본문 바로가기
728x90
반응형
SMALL

Scatter Plot4

피어슨 상관 계수 (Pearson correlation coefficient) 피어슨 상관 계수 (Pearson correlation coefficient) 두 수치 특징을 비교하기 위한 표준 도구는 일반적으로 상관 계수로 알려진 Pearson 상관 계수이다 (다른 상관 계수도 많이 있지만 이 상관 계수가 가장 일반적임). 이것은 두 개의 수치 특징 사이의 선형 연관 강도를 나타내는 수치이다. 형상 사이의 관계가 비선형적이면 이 상관 계수가 오해의 소지가 있을 수 있으므로 산점도와 상관 계수를 모두 검토하는 것이 항상 좋은 방법이다. Key Characteristics 이 계수의 주요 특성은 다음과 같다. 값은 항상 [-1, +1] 간격에 있다. 이 값은 형상 사이의 선형 관계의 강도를 나타낸다. -1에 가까운 값은 형상 사이의 강한 음의 관계를 나타내며, +1에 가까운 값은 형상.. 2023. 7. 13.
자료의 표현 자료의 표현 자료를 요약하고 단순한 통계 방법을 이용하여 분석한다. 그리고 적절한 통계 분석을 통해 통계적 추론은 상식에 맞아야 하며 기술통계적 방법 (descriptive statistics)부터 적용한다. 도표나 그래프의 이용할 때 분명하게 표시 (labeled)해야 하며, 자체적으로 설명 가능(self-explanatory) 해야한다. 너무 자세하지도, 너무 산만하지도 않게 적절하게 표현 (과장 표현은 금물)한다. 빈도표 (Frequency Table) 빈도표 (Frequency Table)는 자료를 요약해서 나타내주는 흔한 방 법 중 하나이다. 이 방법은 자료가 discrete (count)한 경우 많이 쓰인다. 일반적으로 절대 빈도나 상대 빈도가 많이 쓰인다. 절대 빈도 주어진 범주에 속한 개체.. 2022. 11. 4.
[Data Science] 공공포털 데이터 (9) scatter plot scatter plot은 수치형 데이터가 어디 좌표에 위치하는지 출력할 때 주로 이용된다. 보통은 상관계수, 회귀선을 출력하는데 사용하는데 지리 데이터에서도 사용이 가능하다. 이 scatter plot은 데이터가 어디쯤에 위치하는지를 나타냈지만 정확한 위치는 알기 어렵다. 지역에 따라 다른 색으로 표시한다. Folium Folium map에 직관적으로 지역을 표시 가능하다. # folium 설치 conda install -c conda-forge folium import folium df_seoul_hospital["위도"].mean() df_seoul_hospital["경도"].mean() 처음 folium.Map만 찍으면 세계지도가 나오지만 location과 zoom_start.. 2022. 9. 22.
[VPython] Graphs (2) Multiple Plots 동일한 graph에 여러 개의 그림을 추가하려면 동일한 (graph=) parameter를 사용하여 새 그림을 만든다. plot2 = (graph=g,color=color.green,data=[[10,11],[12,13],… ]) 여기서 plot type이 동일할 필요는 없다. Legend 범례 (legend)를 추가하려면 새 그림을 만들 때 (label=) parameter를 사용한다. plot2 = (graph=g,data=[[1,2],[3,4],… ],label=”plot name”) Aside on for loops: for i in range(start,stop): for i in range(start, stop, step size): for i in range(0,1.. 2022. 1. 17.
728x90
반응형
LIST