Pandas 기초

수타. 2023. 5. 31. 19:32

!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

!pip install koreanize-matplotlib #설치
import koreanize_matplotlib #matplotlib import 하고 하면됨

import pandas as pd
import matplotlib.pyplot as plt

plt.rc('font',family = 'NanumBarunGothic') #한글

그리고 csv데이터를 불러온다. 이때 경로에 유의 하며 안에 한글이 들어가 있을경우 encoding 을 'euc-kr' 또는 'cp949'로 해준다.

df = pd.read_csv('/content/drive/MyDrive/jejudata/ftour.csv',encoding='euc-kr') #cp949

head 함수를 통해 상위 n개의 데이터를 확인 가능하며 (n개는 parameter로 조정, dafault는 5개) info 함수와 describe 함수를 통해 데이터의 성질등을 파악할 수 있다. (개수등)

df.head()
df.info()
df.describe()

sum(pd.isnull(df))

df['nat'].unique()

다음과 같이 groupby 함수의 역할을 알 수 있다.

df_count_sort.plot(kind='bar')
plt.show()