본문 바로가기
AI-driven Methodology/Artificial Intelligence

[AI] 평가 모델 (3)

by goatlab 2022. 9. 27.
728x90
반응형
SMALL

Mean Error

 

MSE, MAE 및 RMSE는 회귀 분석에서 예측 오류율과 모델 성능을 평가하는 데 주로 사용된다.

 

MAE (Mean Absolute Error)

 

 

MAE (평균 절대 오차)는 데이터 세트에 대한 평균 절대 차이에 의해 추출된 원래 값과 예측 값 사이의 차이를 나타낸다.

 

from sklearn.metrics import median_absolute_error

y_true = [3, 5, 7]
y_pred = [0, 4, 9]

median_absolute_error(y_true, y_pred)
2.0

 

MSE (Mean Squared Error)

 

https://www.freecodecamp.org/news/machine-learning-mean-squared-error-regression-line-c7dde9a26b93/

 

MSE (평균 제곱 오차)는 데이터 집합에 대한 평균 차이를 제곱하여 추출한 원래 값과 예측 값의 차이를 나타낸다.

 

from sklearn.metrics import mean_squared_error

y_true = [3, 5, 7]
y_pred = [0, 4, 9]

mean_squared_error(y_true, y_pred)
4.666666666666667

 

RMSE (Root Mean Squared Error)

 

https://towardsdatascience.com/what-does-rmse-really-mean-806b65f2e48e

 

RMSE (Root Mean Squared Error)는 MSE의 제곱근에 의한 오류율이다.

 

import math
from sklearn.metrics import mean_squared_error

y_true = [3, 5, 7]
y_pred = [0, 4, 9]

math.sqrt(mean_squared_error(y_true, y_pred))
2.160246899469287

 

결정 계수 (R-squared)

 

https://medium.com/analytics-vidhya/r-squared-formula-explanation-6dc0096ce3ba

 

결정 계수는 회귀 모형에서 독립 변수에 의해 설명되는 종속 변수에 대한 분산의 비율을 나타내는 통계적 측도를 말한다. 두 개의 값의 증감이 얼마나 일관성을 가지는지 나타내는 지표이며, 0에서 1사이의 값인 1에 가까울수록 모델이 해당 데이터에 대한 높은 연관성을 가진다.

 

from sklearn.metrics import r2_score

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

r2_score(y_true, y_pred)
0.9486081370449679

 

피어슨 상관 계수 (Pearson Correlation Coefficient, PCC)

 

https://ko.wikipedia.org/wiki/%ED%94%BC%EC%96%B4%EC%8A%A8_%EC%83%81%EA%B4%80_%EA%B3%84%EC%88%98

 

통계학에서 , 피어슨 상관 계수 (Pearson Correlation Coefficient, PCC)란 두 변수 X  Y 간의 선형 상관 관계를 계량화한 수치다. 피어슨 상관 계수는 코시-슈바르츠 부등식에 의해 +1과 -1 사이의 값을 가지며, +1은 완벽한 양의 선형 상관 관계, 0은 선형 상관 관계 없음, -1은 완벽한 음의 선형 상관 관계를 의미한다. 일반적으로 상관관계는 피어슨 상관관계를 의미하는 상관계수이다.

 

스피어먼 상관 계수 (Spearman rank-order correlation coefficient, SROCC)

 

https://ko.wikipedia.org/wiki/%EC%8A%A4%ED%94%BC%EC%96%B4%EB%A8%BC_%EC%83%81%EA%B4%80_%EA%B3%84%EC%88%98

 

통계에서 스피어먼 상관 계수는 두 변수 순위 사이의 통계적 의존성을 측정하는 비모수적인 척도이다. 이는 두 변수의 관계가 단조함수 (單調函數,monotonic function)를 사용하여 얼마나 잘 설명될 수 있는지를 평가한다.

 

두 변수 간의 스피어먼 상관 계수는 두 변수의 순위 값 사이의 피어슨 상관 계수와 같다. 따라서, 칼 피어슨의 상관 계수가 두 변수 사이의 선형 관계를 평가하는 반면 찰스 스피어먼의 상관 계수는 단조 적 관계 (선형인지 여부는 아님)를 평가한다. 중복 데이터 값이 없으면 각 변수가 다른 변수의 완벽한 단조 함수 일 때 +1 또는 -1의 완벽한 스피어만 상관 관계가 발생한다.

728x90
반응형
LIST