Hodustory/프로그래밍&DB

파이썬/python pandas dataframe 읽고 쓰기

호두밥 2019. 5. 15. 12:07

 

 

pandas 설치하기

pip install openpyxl pandas

dataFrame 만들기

import pandas as pd


#출력하기
display(new_dataframe)

 

엑셀 데이터와 dataFrame에 담기

import pandas as pd
from IPython.display import display, HTML

#엑셀 파일 불러오기
df = pd.read_excel('sample.xlsx', sheet_name='sheet1')

#출력하기
display(df)

 

데이터 상태 확인

#column별 datatype 
print(new_dataframe.dtypes)
#column 상태 보기
print(new_dataframe['name'].describe())

 

 

pandas 기초 기능 / 합계, 평균, 최소값, 최대값

 data['columnA'].sum() # columnA 값의 합계
 data['columnA'].mean() # columnA 값의 평균
 data['columnA'].median() # columnA 값의 중앙값
 data['columnA'].nunique() # columnA 고유값의 갯수
 data['columnA'].max() # columnA의 최대값
 data['columnA'].min() #  columnA의 최소값

pandas 행렬 선택하기

data.iloc[0:10] # 0~10까지의 행 선택하기
data[data["name"] == "나루토"] # 칼럼 name의 값이 "나루토"인 행 선택하기

pandas 행렬 삭제하기

data.drop(columns = 'name') #name 칼럼 삭제하기
data.drop('name', axis=1) #name 컬럼 삭제하기
data.drop([1,2,3], axis=1) #1,2,3 컬럼 삭제하기

data.drop('name', axis=0) #name 행 전부 삭제하기
data.iloc[3:] #3행 전부 삭제하기
data.drop([1,2,3], axis=0) #1,2,3 행 삭제하기

pandas 열 이름 바꾸기

#column 여러 개 이름 바꾸기 
data.rename(
    columns={
        "A": "B",
        "C": "D"
    },
    inplace=True
)

pandas 저장하기

#csv로 저장하기
data.to_csv("output.csv", index=False, encoding='utf-8')

#엑셀excel로 저장하기
data.to_excel("output.xlsx", index=False, encoding='utf-8')

 

 

#오류 ImportError: Install xlrd >= 0.9.0 for Excel support 발생시

pip install xlrd

#오류 AttributeError: module 'pandas' has no attribute 'display' 발생시

pip install Ipython

 

 

반응형