본문 바로가기
Python Library/Pandas

[Pandas] 데이터 전처리 (2)

by goatlab 2022. 7. 24.
728x90
반응형
SMALL

열 (column) 데이터 추출하기

 

데이터프레임 (DataFrame)에서 열 (column) 단위 데이터를 추출하기 위해서는 대괄호 안에 열 이름을 사용한다.

 

df_job = df['Job']
df_job

df_job = df[['Job']]
df_job

cols = ['Country', 'Job']
# df_country_job = df[cols]

df_country_job = df[['Country','Job']]
df_country_job

 

인덱스 / 행 번호

 

Pandas에서는 df.loc[인덱스], df.iloc[행 번호] 사용하여 행 단위로 데이터를 가져온다.

 

loc 인덱스 기준으로 행 데이터 읽기
iloc 행 번호를 기준으로 행 데이터 읽기
행 번호 인덱스 Name Country Age Job
0 0 John USA 31 Student
1 1 Sabre France 33 Lawyer
2 2 Kim Korea 28 Developer
3 3 Sato Japan 40 Chef
4 4 Lee Korea 36 Professor
5 5 Smith USA 55 CEO
6 6 David USA 48 Banker

 

인덱스가 행 번호처럼 보이지만, 인덱스는 문자열이나 임의의 숫자를 지정해도 무방하다. 인덱스는 보통 0 부터 시작하지만 행 데이터를 추가, 삭제하면 언제든 변할 수 있다.

 

행 번호 인덱스 Name Country Age Job
0 0 John USA 31 Student
1 1 Sabre France 33 Lawyer
2 3 Sato Japan 40 Chef
3 4 Lee Korea 36 Professor
4 5 Smith USA 55 CEO
5 6 David USA 48 Banker

 

df.drop([2]) 명령을 통해 보기와 같이 2번 인덱스를 삭제하면, 행 번호는 원래와 같이 0부터 시작해서 순서대로 이어지지만, 인덱스는 연속적인 순서가 아닌 것을 확인 할 수 있다.

 

df.loc : 행(row) 데이터 추출

 

df_1st_row = df.loc[[0]]
df_1st_row

df_1st_4th_row = df.loc[[0, 3]]
df_1st_4th_row

df_slice = df.loc[0 : 3]
df_slice

df.loc : 조건에 맞는 행 (row) 데이터 추출

 

df.loc[df['Country'] == 'USA']

df.loc[df['Age'] > 30]

 

df.loc : 행과 열 데이터 동시 추출

 

df.loc[[1], : ]

df.loc[[1,3], ['Name', 'Job']]

df.loc[ :, : ]

728x90
반응형
LIST

'Python Library > Pandas' 카테고리의 다른 글

[Pandas] pandas.read_csv  (0) 2022.08.11
[Pandas] 데이터 전처리 (3)  (0) 2022.07.24
[Pandas] 데이터 전처리 (1)  (0) 2022.07.23
[Pandas] 피클 불러오기  (0) 2022.06.03
[Pandas] 데이터프레임 모든 행, 열 출력  (0) 2022.05.12