pandas 설치하기
pip install openpyxl pandas
dataFrame 만들기
import pandas as pd
#출력하기
display(new_dataframe)
엑셀 데이터와 dataFrame에 담기
import pandas as pd
from IPython.display import display, HTML
#엑셀 파일 불러오기
df = pd.read_excel('sample.xlsx', sheet_name='sheet1')
#출력하기
display(df)
데이터 상태 확인
#column별 datatype
print(new_dataframe.dtypes)
#column 상태 보기
print(new_dataframe['name'].describe())
pandas 기초 기능 / 합계, 평균, 최소값, 최대값
data['columnA'].sum() # columnA 값의 합계
data['columnA'].mean() # columnA 값의 평균
data['columnA'].median() # columnA 값의 중앙값
data['columnA'].nunique() # columnA 고유값의 갯수
data['columnA'].max() # columnA의 최대값
data['columnA'].min() # columnA의 최소값
pandas 행렬 선택하기
data.iloc[0:10] # 0~10까지의 행 선택하기
data[data["name"] == "나루토"] # 칼럼 name의 값이 "나루토"인 행 선택하기
pandas 행렬 삭제하기
data.drop(columns = 'name') #name 칼럼 삭제하기
data.drop('name', axis=1) #name 컬럼 삭제하기
data.drop([1,2,3], axis=1) #1,2,3 컬럼 삭제하기
data.drop('name', axis=0) #name 행 전부 삭제하기
data.iloc[3:] #3행 전부 삭제하기
data.drop([1,2,3], axis=0) #1,2,3 행 삭제하기
pandas 열 이름 바꾸기
#column 여러 개 이름 바꾸기
data.rename(
columns={
"A": "B",
"C": "D"
},
inplace=True
)
pandas 저장하기
#csv로 저장하기
data.to_csv("output.csv", index=False, encoding='utf-8')
#엑셀excel로 저장하기
data.to_excel("output.xlsx", index=False, encoding='utf-8')
#오류 ImportError: Install xlrd >= 0.9.0 for Excel support 발생시
pip install xlrd
#오류 AttributeError: module 'pandas' has no attribute 'display' 발생시
pip install Ipython
반응형