본문 바로가기
Python Library/Pandas

[Pandas] 데이터 전처리 (1)

by goatlab 2022. 7. 23.
728x90
반응형
SMALL

데이터프레임 (Dataframe)

 

데이터프레임은 dictionary 데이터 또는 list 데이터를 이용해서 생성할 수 있다.

 

import pandas as pd

data_dict = { 'Name' : ['John', 'Sabre', 'Kim', 'Sato', 'Lee', 'Smith', 'David'],
              'Country' : ['USA', 'France', 'Korea', 'Japan', 'Korea', 'USA', 'USA'],
              'Age' : [31, 33, 28, 40, 36, 55, 48],
              'Job' : ['Student', 'Lawyer', 'Developer', 'Chef', 'Professor', 'CEO', 'Banker']    
}

df = pd.DataFrame(data_dict)
import pandas as pd

data_list = [['John', 'USA', 31, 'Student'],
             ['Sabre', 'France', 33, 'Lawyer'],
             ['Kim', 'Korea', 28, 'Developer'],
             ['Sato', 'Japan', 40, 'Chef'],
             ['Lee', 'Korea', 36, 'Professor'],
             ['Smith', 'USA', 55, 'CEO'],
             ['David', 'USA', 48, 'Banker']
]

column_name = ['Name', 'Country', 'Age', 'Job']

df = pd.DataFrame(data_list, columns = column_name)

df.head() # index 처음부터 5개 출력

df.tail() # index 끝에서 역순으로 5개 출력

df.info()

df.describe()

df.describe(include=['O'])

 

데이터프레임 csv 파일 저장

 

df.to_csv('./index.csv', index=True)
df.to_csv('./noindex.csv', index=False)
df.to_csv('./header.csv', header=True)
df.to_csv('./noheader.csv', header=False)
df.to_csv('./noindex_noheader.csv', index=False, header=False)
import pandas as pd

df = pd.read_csv('./noindex_noheader.csv', header=None)
df

cols = ['Name', 'Country', 'Age', 'Job']

df.columns = cols
df

728x90
반응형
LIST