본문 바로가기
Data-driven Methodology/DS (Data Science)

[Data Science] 공공포털 데이터 (9)

by goatlab 2022. 9. 22.
728x90
반응형
SMALL

scatter plot

 

scatter plot은 수치형 데이터가 어디 좌표에 위치하는지 출력할 때 주로 이용된다. 보통은 상관계수, 회귀선을 출력하는데 사용하는데 지리 데이터에서도 사용이 가능하다.

 

 

이 scatter plot은 데이터가 어디쯤에 위치하는지를 나타냈지만 정확한 위치는 알기 어렵다. 지역에 따라 다른 색으로 표시한다.

 

Folium

 

Folium map에 직관적으로 지역을 표시 가능하다.

 

# folium 설치
conda install -c conda-forge folium
import folium

df_seoul_hospital["위도"].mean()
df_seoul_hospital["경도"].mean()

 

처음 folium.Map만 찍으면 세계지도가 나오지만 location과 zoom_start를 찍으면 위치를 설정할 수 있다. folium에서는 tiles='Stamen Toner' 설정으로 테마를 바꿀 수 있고, popup도 출력할 수 있고, 마커도 설정할 수 있다.

 

map = folium.Map(location=[df_seoul_hospital["위도"].mean(),df_seoul_hospital["경도"].mean()], zoom_start=1)

for n in df_seoul_hospital.index:
    name = df_seoul_hospital.loc[n, "상호명"]
    address = df_seoul_hospital.loc[n, "도로명주소"]
    popup = f"{name}-{address}"
    location = [df_seoul_hospital.loc[n, "위도"], df_seoul_hospital.loc[n, "경도"]]
    
    folium.Marker(
        location = location,
        popup = popup,
    ).add_to(map)
    
map

 

함수를 통해 마커와 팝업을 찍어낼 수 있다. 지도를 찍어보면 서울 외곽에 갈수록 종합병원 수가 적다는 것을 알 수 있다.

 

728x90
반응형
LIST