728x90
반응형
SMALL
열 (column) 데이터 추출하기
데이터프레임 (DataFrame)에서 열 (column) 단위 데이터를 추출하기 위해서는 대괄호 안에 열 이름을 사용한다.
df_job = df['Job']
df_job
df_job = df[['Job']]
df_job
cols = ['Country', 'Job']
# df_country_job = df[cols]
df_country_job = df[['Country','Job']]
df_country_job
인덱스 / 행 번호
Pandas에서는 df.loc[인덱스], df.iloc[행 번호] 사용하여 행 단위로 데이터를 가져온다.
loc | 인덱스 기준으로 행 데이터 읽기 |
iloc | 행 번호를 기준으로 행 데이터 읽기 |
행 번호 | 인덱스 | Name | Country | Age | Job |
0 | 0 | John | USA | 31 | Student |
1 | 1 | Sabre | France | 33 | Lawyer |
2 | 2 | Kim | Korea | 28 | Developer |
3 | 3 | Sato | Japan | 40 | Chef |
4 | 4 | Lee | Korea | 36 | Professor |
5 | 5 | Smith | USA | 55 | CEO |
6 | 6 | David | USA | 48 | Banker |
인덱스가 행 번호처럼 보이지만, 인덱스는 문자열이나 임의의 숫자를 지정해도 무방하다. 인덱스는 보통 0 부터 시작하지만 행 데이터를 추가, 삭제하면 언제든 변할 수 있다.
행 번호 | 인덱스 | Name | Country | Age | Job |
0 | 0 | John | USA | 31 | Student |
1 | 1 | Sabre | France | 33 | Lawyer |
2 | 3 | Sato | Japan | 40 | Chef |
3 | 4 | Lee | Korea | 36 | Professor |
4 | 5 | Smith | USA | 55 | CEO |
5 | 6 | David | USA | 48 | Banker |
df.drop([2]) 명령을 통해 보기와 같이 2번 인덱스를 삭제하면, 행 번호는 원래와 같이 0부터 시작해서 순서대로 이어지지만, 인덱스는 연속적인 순서가 아닌 것을 확인 할 수 있다.
df.loc : 행(row) 데이터 추출
df_1st_row = df.loc[[0]]
df_1st_row
df_1st_4th_row = df.loc[[0, 3]]
df_1st_4th_row
df_slice = df.loc[0 : 3]
df_slice
df.loc : 조건에 맞는 행 (row) 데이터 추출
df.loc[df['Country'] == 'USA']
df.loc[df['Age'] > 30]
df.loc : 행과 열 데이터 동시 추출
df.loc[[1], : ]
df.loc[[1,3], ['Name', 'Job']]
df.loc[ :, : ]
728x90
반응형
LIST
'Python Library > Pandas' 카테고리의 다른 글
[Pandas] pandas.read_csv (0) | 2022.08.11 |
---|---|
[Pandas] 데이터 전처리 (3) (0) | 2022.07.24 |
[Pandas] 데이터 전처리 (1) (0) | 2022.07.23 |
[Pandas] 피클 불러오기 (0) | 2022.06.03 |
[Pandas] 데이터프레임 모든 행, 열 출력 (0) | 2022.05.12 |