Hodustory/프로그래밍&DB 118

파이썬(python) 입문 : rdflib 패키지 1 (설치, rdf파일 읽어오기)

안녕하세요!. 호두입니다. 오늘은 RDFlib 패키지를 소개해드리려 합니다. RDF는 S-V-O의 형태로 이루어진 db형태를 말하는데요. 자세한 내용은 다음에 가져올게요! RDFLib은 RDF에서 작동하는 패키지 입니다. 다음과 같은 기능을 지원합니다.RDF/XML, N3, NTriples, N-Quads, Turtle, Trix, RDFa, MicroData를 위한 파서와 직렬변환기다양한 스토어 중 하나에서 지원받는 Graph 인터페이스버클리 DB 위에 메모리 저장 및 영구 저장을 위한 저장 실행SPARQL 1.1 지원RDFLib 설치 RDFLib을 설치하는 가장 좋은 방법은 easy_install 이나 pip을 쓰는 것입니다. $ easy_intall rdfilbIRD 채널의 #rdflib나 rdfl..

파이썬(Python) 입문 : 크롤링, Beautiful Soup

BeautifulSoup BeautifulSoup은 HTML이나 XML에서 데이터를 추출하는 파이썬 라이브러리입니다. 웹문서의 구조를 찾아내는 파서를 이용해 찾고자 하는 데이터의 위치를 찾아 내어 값을 추출합니다. 우선 beautifulSoup 패키지를 설치한 후, 데이터를 추출하려는 페이지의 url을 입력해줍니다. url의 웹문서 전체를 불러와 변수로 담아줍니다. 이때 request 패키지를 설치한 후 content 함수를 이용합니다. from bs4 import BeautifulSoup import requests base_url = 'http://dh.aks.ac.kr/Encyves/wiki/index.php/조선_세종' con = requests.get(base_url) soup = Beautif..

파이썬(python) 입문 : json으로 데이터 저장하기

Saving Structured Data with JSON 문자열은 파일에서 쉽게 쓰고 읽을 수 있습니다. 숫자는 조금 더 많은 노력이 듭니다. read() 메소드가 오직 문자열만 반환하기 때문이고, int() 같은 함수에 전달되어야 '123'같은 문자열을 숫자값으로 반환해줍니다. 리스트나 딕셔너리 묶음과 같은 복잡한 데이터타입을 저장하는 경우, 파싱이나 직렬화 하는 것이 복잡해집니다. 복잡한 데이터 타입을 파일에 저장하기 위해 지속적으로 코드를 작성하고 디버그하는 대신, 파이썬은 JSON이란 유명한 파일교환 형식을 사용합니다. JSON은 파이썬 데이터의 계층을 가져와서 문자열로 변환할 수 있습니다. 이 프로세스를 serializing이라 부릅니다. 문자열 표현에서 데이터를 재구조화 하는 것은 reser..

파이썬(python) 입문 : 패키지(Packages)

Packages 패키지는 "점으로 구분된" 파이썬 모듈의 네임스페이스 구조를 사용하는 방법입니다. 모듈 이름 A.B는 A라는 패키지 안의 모듈 B를 의미합니다. 이렇게 점으로 구분된 모듈을 쓰면 NumPy나 Python 이미지 라이브러리 같이 다중 모듈 패키지에서 모두 다른 이름을 쓰는 것을 걱정하지 않아도 됩니다. 소리 파일이나 데이터를 다루는 패키지를 만들고자 합니다. 다양한 소리 파일 포맷(wav, aiff, au)들이 있기 때문에, 다양한 모듈을 수집하여 패키지를 성장시키고 유지시켜야 할 것입니다. 소리 데이터로 할 수 있는 많은 기능(믹싱, 에코 추가, 이퀄라이저 등)들이 있어서, 당신은 이 작업을 수행하기 위해 끝없는 모듈의 흐름을 작성하게 될 것입니다. 여기 당신의 패키지에 대한 가능한 구조..

파이썬(python) 입문 : 기본 모듈, dir()함수

기본 모듈(Standard Modules) 파이썬은 표준 모듈 라이브러리를 제공합니다. 일부 모듈은 인터프리터에 내장되어 있습니다. 이것들은 시스템 호출 같은 운영 체제의 기본 요소에 대한 접근을 제공하거나 효율성을 제공합니다. 이런 모듈 세트는 기본 플랫폼에 의존하는 구성 옵션입니다. winreg 모듈은 윈도우 시스템에서만 제공됩니다. 모든 파이썬 인터프리터에 내장된 sys 모듈은 주의가 필요합니다. 변수 sys.ps1과 sys.ps2는 첫번째와 두번째 프롬프트에서 쓰이는 문자열을 정의합니다. >>> import sys>>> sys.ps1'>>> '>>> sys.ps2'... ' 이 두개의 변수는 오직 활동중인 인터프리터에서만 작동합니다.변수 sys.path는 모듈을 위한 인터프리터의 검색 패스를 결정..

파이썬(python) 입문 : Modules

Modules(모듈) 파이썬 인터프리터를 닫고 다시 들어가면, 만들어 놓은 정의(변수나 함수)가 모두 지워집니다. 그래서 긴 프로그램을 짜려면, 파일 채로 넣어서 인터프리퍼에 넣어 출력할 수 있도록 문서 에디터를 이용합니다. 이런 과정을 '스크립트 작성'이라 합니다. 프로그램이 점점 길어지면, 몇개의 파일을 유지하기 쉽도록 하나의 파일로 보관하고 싶을 것입니다. 또한 각 프로그램에서 정의를 복사하지 않고 여러 프로그램에서 작성한 편리한 기능을 사용할 수도 있습니다. 이것을 지원하기 위해서, 파이썬은 정의를 파일에 넣고 인터프리터의 상호적인 개체나 스크립트에서 사용하는 기능을 지원합니다. 이런 파일들을 모듈(Modules)이라 부릅니다. 모듈에서 온 정의는 다른 모듈이나 메인 묘듈(최상위 레벨이나 계산 모..

파이썬(python) 입문 : Dictionaries, loop

1. Dictionaries딕셔너리는 변하지 않는 타입의 keys로 색인됩니다. (글자나 숫자는 항상 keys가 될 수 있습니다.) 튜플들도 문자열이나 숫자, 튜플로만 구성되어 있다면 keys로 이용될 수 있습니다. 튜플이 직접적으로, 간접적으로 변할 수 있는 개채를 포함하고 있다면, keys로 사용할 수 없습니다. 리스트는 색인이나 쪼개기, append()나 extend()와 같은 Method를 통해 위치가 변할 수 있으므로 keys로 이용될 수 없습니다.딕셔너리는 순서가 없는 '키:값'(유일한 값들의 모임)입니다. 중괄호 두개는 빈 딕셔너리를 만듭니다. 중괄호 안에 컴마로 구분된 '키:값'의 리스트는 처음 키:값을 딕셔너리에 더합니다. 이것은 딕셔너리가 산출물에 쓰여지는 방식이기도 합니다.딕셔너리의 ..

파이썬(python) 입문 : del, Tuple, Sequence, sets

1. del 구문값 대신 색인을 넣어 리스트의 개체를 지우는 방법입니다. pop() 메소드와 반환되는 값에서 차이가 있습니다. del 구문은 리스트에서 조각을 없애거나 리스트 전체를 지울 때 사용합니다. n = [1, 2,3,4,5,6,7,8,9,10] del n[0] print(n) del n[0:3] print(n) del n[:] print(n)[2, 3, 4, 5, 6, 7, 8, 9, 10] [5, 6, 7, 8, 9, 10] []del은 모든 변수를 지우는 데도 사용할 수 있습니다.n=1 del n print(n)NameError: name 'n' is not defined2. 튜플과 시퀀스 (Tuples and Sequences)우리는 리스트와 스트링이 색인이나 쪼개기 같은 많은 공통적인 속..

파이썬(Python) 입문 : List

1. List 확장하기 (list Method)리스트 데이터타입은 몇가지 메소드(내장함수)를 가지고 있습니다. list.append(x)리스트의 끝에 하나의 값을 더해줍니다. a[len(a):] = [x]와 같습니다.list.extend(iterable)입력된 값의 모든 값이 list에 더해집니다. a[len(a):] = iterable 과 같습니다. list= ['a', 'b'] list.append('append') list.extend('extend') print(list)['a', 'b', 'append', 'e', 'x', 't', 'e', 'n', 'd']list.insert(i,x)주어진 위치에 값을 삽입합니다. 첫번째 인수는 삽입되기 전 요소의 색인 위치입니다. a.insert(0,x)는 ..

파이썬(python) 입문 : 코딩 스타일 안내

코딩 스타일 안내 (Intermezzo : Coding Style)파이썬으로 길고 복잡한 구문을 만들려 한다면, 코딩스타일을 이야기할 좋은 때입니다. 대부분의 언어가 다른 스타일들로 쓰여집니다. 너의 코드를 남들이 읽기 쉽게 만드는 것은 언제나 좋은 생각이며, 좋은 코딩스타일을 채택하는 것은 엄청난 도움이 됩니다.파이썬에서 PEP8은 대부분의 프로젝트에서 고수하는 스타일 가이드입니다. 이것은 매우 읽기 쉽고 눈에 편한 코딩스타일을 지향합니다. 모든 파이썬 개발자가 이것을 참고합니다. 여기 당신을 위해 추출된 몇가지 중요한 점이 있습니다. 띄어쓰기는 탭이 아니라 4개의 스페이스를 사용하세요.문장을 글자수 79가 넘지 않다록 하세요.빈 문장을 이용하서 클래스와 함수를 분리하고, 함수 내에서 더 큰 코드 블록..

반응형