본문 바로가기
Statistics

피어슨 상관 계수 (Pearson correlation coefficient)

by goatlab 2023. 7. 13.
728x90
반응형
SMALL

피어슨 상관 계수 (Pearson correlation coefficient)

 

https://www.analyticsvidhya.com/blog/2021/01/beginners-guide-to-pearsons-correlation-coefficient/

 

두 수치 특징을 비교하기 위한 표준 도구는 일반적으로 상관 계수로 알려진 Pearson 상관 계수이다 (다른 상관 계수도 많이 있지만 이 상관 계수가 가장 일반적임). 이것은 두 개의 수치 특징 사이의 선형 연관 강도를 나타내는 수치이다. 형상 사이의 관계가 비선형적이면 이 상관 계수가 오해의 소지가 있을 수 있으므로 산점도와 상관 계수를 모두 검토하는 것이 항상 좋은 방법이다.

 

Key Characteristics

 

이 계수의 주요 특성은 다음과 같다.

 

  • 값은 항상 [-1, +1] 간격에 있다.
  • 이 값은 형상 사이의 선형 관계의 강도를 나타낸다. -1에 가까운 값은 형상 사이의 강한 음의 관계를 나타내며, +1에 가까운 값은 형상 사이의 강한 양의 관계를 나타낸다. 0에 가까운 값은 형상 사이에 선형 관계가 없음을 나타낸다.
  • 값이 정확히 0이면 선형 관계가 없음을 나타낸다. 정확하게 -1 또는 +1 값은 변수 간의 완벽한 선형 관계를 나타낸다. -1은 음수이고 +1은 양수이다.

 

형상 사이에 선형 연관성이 없는 경우 상관 계수는 0에 매우 가까워야 한다. 그러나 계수가 0에 가깝더라도 형상 사이에 연관성이 없다는 것을 의미하지는 않으며 비선형 관계가 계속 존재할 수 있다. 따라서 항상 상관 계수와 함께 산점도를 사용해야 한다.

 

 

산점도 (Scatter Plot)

 

산점도는 직교 좌표계를 이용해 좌표상의 점들을 표시함으로써 두 개 변수 간의 관계를 나타내는 그래프 방법이다. 도표 위에 두 변수 X와 y 값이 만나는 지점을 표시한 그림. 이 그림을 통해 두 변수 사이의 관계를 알 수 있다.

728x90
반응형
LIST

'Statistics' 카테고리의 다른 글

G*Power  (0) 2023.07.17
신뢰 구간 (Confidence interval)  (0) 2023.07.14
급내 상관 계수 (Intraclass Correlation Coefficients)  (0) 2023.07.12
유의 확률 (P-Value)  (0) 2023.07.03
Cohen's Kappa  (0) 2023.07.03