본문 바로가기
Data-driven Methodology/DS (Data Science)

[Data Science] 공공포털 데이터 (8)

by goatlab 2022. 9. 22.
728x90
반응형
SMALL

 특정 지역만 보기

 

서울특별시의 데이터만 샘플링을 진행한다.

 

df_seoul = df[df["시도명"] == "서울특별시"].copy()
df_seoul.shape

 

서울시의 구에 얼마나 많은 가게가 있는지 파악한다.

 

df_seoul ["시도명"].value_counts()

# bar plot
df_seoul ["시도명"].value_counts().plot.bar(figsize=(10, 4), rot=30)

# seaborn count plot
plt.figure(figsize=(15, 4))
sns.countplot(data=df_seoul, x="시군구명")

# matplotlib scatter plot
df_seoul[["경도", "위도", "시군구명"]].plot.scatter(x="경도", y="위도", figsize=(8, 7), grid=True)

 

hue를 활용하여 상권업종중분류 별로 다른 색상을 적용하여 그린다.

 

plt.figure(figsize=(9, 8))
sns.scatterplot(data=df_seoul, x="경도", y="위도", hue="상권업종중분류명")

 

hue를 활용하여 구별로 다른 색상을 적용하여 그려 본다.

 

plt.figure(figsize=(9, 8))
sns.scatterplot(data=df_seoul, x="경도", y="위도", hue="시군구명")

# (16, 12) 사이즈
plt.figure(figsize=(16, 12))
sns.scatterplot(data=df_seoul, x="경도", y="위도", hue="시도명")

728x90
반응형
LIST