본문 바로가기
Statistics/Bayesian Inference

[Bayesian Inference] 분산 분석 (ANOVA)

by goatlab 2022. 4. 13.
728x90
반응형
SMALL

분산 분석 (analysis of variance)

 

https://www.tibco.com/reference-center/what-is-analysis-of-variance-anova

 

분산 분석 (分散分析, analysis of variance, ANOVA, 또는 변량 분석)은 통계학에서 두 개 이상 다수의 집단을 서로 비교하고자 할 때 집단 내의 분산, 총평균 그리고 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법이다. 통계학자이자 유전학자인 로날드 피셔 (R.A. Fisher)에 의해 1920년대에서 1930년대에 걸쳐 만들어졌다.

 

다른 그룹의 평균(또는 평균)에 걸쳐 분산을 비교하는 데 사용되는 통계 공식이다. 다양한 시나리오에서 이를 사용하여 다른 그룹의 평균 간에 차이가 있는지 확인한다.

 

예를 들어, 다양한 당뇨병 약물의 효과를 연구하기 위해 과학자들은 약물 유형과 그에 따른 혈당 수치 간의 관계를 조사하기 위해 설계하고 실험한다. 표본 모집단은 사람들의 집합이다. 우리는 표본 집단을 여러 그룹으로 나누고 각 그룹은 시험 기간 동안 특정 약을 받는다. 시험 기간이 끝나면 혈당 수치가 개별 참가자 각각에 대해 측정된다. 그런 다음 각 그룹에 대해 평균 혈당 수치가 계산된다. ANOVA는 이러한 그룹 평균을 비교하여 통계적으로 다른지 또는 유사한지 알아내는 데 도움이 된다.

 

ANOVA의 결과는 'F 통계량'이다. 이 비율은 그룹 내 분산과 그룹 간 분산의 차이를 보여주므로 궁극적으로 귀무 가설이 지지되거나 기각된다는 결론을 내릴 수 있는 그림이 생성된다. 그룹 간에 유의한 차이가 있는 경우 귀무 가설이 지지되지 않으며 F-비율이 더 커진다.

 

  • 종속변수 (Dependent variable) : 독립변수의 영향을 받는 것으로 이론화된 측정항목이다.
  • 독립변수 (Independent variable) : 종속변수에 영향을 미칠 수 있는 측정항목이다.
  • 귀무가설 (H0) : 그룹이나 평균 간에 차이가 없는 경우이다. ANOVA 테스트 결과에 따라 귀무가설이 채택되거나 기각된다.
  • 대립가설 (H1) : 집단과 평균 사이에 차이가 있다고 이론화하는 경우
  • 요인 및 수준 (Factors and levels) : ANOVA 용어에서 독립변수를 종속변수에 영향을 미치는 요인이라고 한다. 수준은 실험에 사용되는 독립 변수의 다른 값을 나타낸다.
  • 고정 요인 모형 (Fixed-factor model) : 일부 실험에서는 요인에 대해 이산 수준 집합만 사용한다. 예를 들어, 고정 요인 테스트는 세 가지 다른 복용량의 약물을 테스트하고 다른 복용량은 확인하지 않는 것이다.
  • 랜덤 요인 모델 (Random-factor model) : 이 모델은 독립 변수의 가능한 모든 값에서 레벨의 랜덤 값을 가져온다.

 

https://ko.wikipedia.org/wiki/%EB%B6%84%EC%82%B0_%EB%B6%84%EC%84%9D

 

분산 분석 - 위키백과, 우리 모두의 백과사전

분산 분석(分散分析, analysis of variance, ANOVA, 또는 변량 분석)은 통계학에서 두 개 이상 다수의 집단을 서로 비교하고자 할 때 집단 내의 분산, 총평균 그리고 각 집단의 평균의 차이에 의해 생긴

ko.wikipedia.org

 

728x90
반응형
LIST