본문 바로가기
Data-driven Methodology/DS (Data Science)

[Data Science] 공공포털 데이터 (5)

by goatlab 2022. 9. 21.
728x90
반응형
SMALL

seaborn : 그래프 그리기

 

seaborn은 대체로 x, y의 data를 기본으로 넣어줘야 하지만 countplot은 x,y 중 하나만 넣어도 된다.

 

sns.countplot(data=df, y="시도명")

 

데이터 가공

 

상권업종대분류명의 데이터 값 당 개수를 센다.

 

df["상권업종대분류명"].value_counts()

 

상권업종중분류명의 데이터 값 당 개수를 센다. 이 데이터를 c라는 변수로 지정한다.

 

c = df["상권업종중분류명"].value_counts()
c.plot.bar(rot=0)

c = df["상권업종소분류명"].value_counts()
c.plot.bar()

c.plot.bar(figsize=(7,8), grid=True)

 

normalize는 전체 대비 비율을 보여 준다. 이 데이터를 n이라는 변수로 지정한다.

 

n = df["상권업종중분류명"].value_counts(normalize=True)
n.plot.pie()

728x90
반응형
LIST