728x90
반응형
SMALL
Group Data
# "a" 컬럼값을 Groupby하여 "b"의 컬럼값 평균값 구하기
df.groupby(["a"])["b"].mean()
# pivot_table로 평균값 구하기
pd.pivot_table(df, index="a")
"a" 컬럼에 있는 값이 4가 두 개가 있기 때문에 그 값의 평균값이 적용된다.
Plotting
데이터를 가지고 다양한 시각화할 수 있다.
# 꺾은선 그래프 그리기
df.plot()
# 막대그래프 그리기
df.plot.bar()
# 밀도함수 그리기
df.plot.density()
728x90
반응형
LIST
'Data-driven Methodology > DS (Data Science)' 카테고리의 다른 글
[Data Science] 공공포털 데이터 (2) (0) | 2022.09.19 |
---|---|
[Data Science] 공공포털 데이터 (1) (0) | 2022.09.18 |
[Data Science] Pandas Cheat Sheet (1) (0) | 2022.09.18 |
[Data Science] EDA (Exploratory Data Analysis) (0) | 2022.08.26 |
캐글 (Kaggle) (0) | 2022.08.13 |