본문 바로가기
728x90
반응형
SMALL

Statistics/Bayesian Inference7

[Bayesian Inference] 분산 분석 (ANOVA) 분산 분석 (analysis of variance) 분산 분석 (分散分析, analysis of variance, ANOVA, 또는 변량 분석)은 통계학에서 두 개 이상 다수의 집단을 서로 비교하고자 할 때 집단 내의 분산, 총평균 그리고 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법이다. 통계학자이자 유전학자인 로날드 피셔 (R.A. Fisher)에 의해 1920년대에서 1930년대에 걸쳐 만들어졌다. 다른 그룹의 평균(또는 평균)에 걸쳐 분산을 비교하는 데 사용되는 통계 공식이다. 다양한 시나리오에서 이를 사용하여 다른 그룹의 평균 간에 차이가 있는지 확인한다. 예를 들어, 다양한 당뇨병 약물의 효과를 연구하기 위해 과학자들은 약물 유.. 2022. 4. 13.
[Bayesian Inference] Computation Computation 많은 실제 문제에서 필요한 계산은 베이지안 방법을 적용하는 데 주요 장애물이다. 최근까지 계산이 어려워 베이지안 통계를 사용하는 실제 응용 프로그램의 수가 적었다. 필요한 최적화 및 통합을 위해 몬테카를로 근사치를 제공하는 데이터 증대 및 보다 일반적인 MCMC (Markov Chain Monte Carlo)와 같은 반복 시뮬레이션 방법의 도입으로 베이지안 방법이 주류 응용 프로그램에 도입되었다. 표는 베이지안 추론에 사용되는 최적화 및 통합 알고리즘의 일부를 나열한다. (참고 : 공액 우선순위 방법을 제외하고 표의 모든 알고리즘은 근사치) Markov Chain Monte Carlo 베이지안 추론의 적분은 종종 다루기 힘들지만 샘플링 방법을 사용하여 수치적으로 평가할 수 있다. ".. 2022. 3. 28.
[Bayesian Inference] 모델 선택 (Model Selection) 모델 선택 (Model Selection) 때때로 하나 이상의 모델을 가질 수 있으며 우리의 관심은 각 모델의 적합성을 평가하고 모델 선택을 수행하는 데 집중할 수 있다. 베이지안 모델 선택 절차를 설명하기 위해 "null" 모델 M = 0과 대안 모델 M = 1 간의 비교에 중점을 둔다. 이 경우 해당 조인트 pdf는 다음과 같다. y가 매개변수를 통해 모델에 의존한다고 가정하면 다음과 같다. 여기서 π(θm | M = m, I)는 모델 M = m에서 매개변수 θm에 대한 선험적 분포이고 π(M = m | I)는 모델 M = m의 선험적 확률이다. 모델 M = m에 대한 사후 확률은 증거에 비례한다. 최적의 모델은 선험적 분포 π(M = m | I)의 선택은 분명히 응용 프로그램에 따라 다르다. 두 모.. 2022. 3. 28.
[Bayesian Inference] 가우스 혼합 모델 (Gaussian Mixture Model) 가우스 혼합 모델 (Gaussian Mixture Model) 가우스 혼합 모델 (GMM)에서 임의의 M 차원 pdf를 K < M인 K 가우스 밀도의 합으로 모델링한다. 널리 사용되지만 EM / GMM 알고리즘은 로컬 최소값으로 수렴하거나 입력 데이터의 특이성 또는 축퇴로 인해 실패할 수 있다. 또한 GMM은 "차원의 저주"를 겪는다. 입력 데이터의 차원이 증가함에 따라 평균 μk, k ∈ {1, 2, ..., K} 및 공분산 행렬 Σk는 기하급수적으로 증가한다. 매개변수 수가 기하급수적으로 증가하는 것을 막는 한 가지 방법은 공분산 행렬의 구조를 제한하는 것이다. 덜 과감한 해결책은 Gaussian의 혼합물 대신 확률적 PCA의 혼합물을 사용하는 것이다. 2022. 3. 28.
[Bayesian Inference] 사후 분포 (A Posterior Distribution) 사후 분포 (A Posterior Distribution) 베이지안 추론은 데이터 y를 고려한 후 매개변수 θ의 모든 가능한 값의 확률을 조사하여 도출된다. 하이퍼파라미터 λ가 알려지거나 추정되면 Bayes의 정리를 적용하여 사후 pdf를 얻는다. 분모 p(y | I) = p(y | θ, I) π (θ | λ, I)dθ는 증거로 알려져 있으며 p(θ | y, I) 하나로 통합된다. 결합 분포에서 관측 데이터 y를 제외한 모든 변수를 통합하여 증거를 얻는다. 하이퍼파라미터 λ를 모르는 경우 통합을 통해 이를 제거할 수도 있다. 여기서 π(λ | I)는 λ이다. 주어진 데이터 y에서 θ에 대한 지식을 어떻게 체계적으로 업데이트할 수 있는지 알려준다. 예를 들어, 관측값이 한 번에 하나씩 얻어지면 다음과 같이.. 2022. 3. 28.
[Bayesian Inference] 베이지안 분석 (Bayesian Analysis) Bayesian Analysis 베이지안 통계의 기본 전제는 모든 미지수가 확률 변수로 취급되고 이러한 양에 대한 지식이 확률 분포를 통해 요약된다는 것이다. 베이지안 통계 사용의 주요 이점은 다음과 같다. 1. 베이지안 통계는 객관적이고 주관적인 불확실성을 정량화하기 위한 유일하게 알려진 일관된 시스템이다. 2. 베이지안 통계는 모델 추정 및 비교와 새로운 관찰의 분류를 위한 원칙적 방법을 제공한다. 3. 베이지안 통계는 다양한 센서 관찰을 결합하는 자연스러운 방법을 제공한다. 4. 베이지안 통계는 누락된 정보를 처리하는 주요 방법을 제공한다. 확률 모델 (Probability Model) 이 단계에서는 고려 중인 모든 변수 간의 관계를 캡처하는 공동 확률 분포를 만든다. 전체 확률 모델 또는 공동 확.. 2022. 3. 28.
베이지안 추론 (Bayesian Inference) 베이지안 추론 (Bayesian Inference) 베이즈 추론 (Bayesian inference)은 통계적 추론의 한 방법으로, 추론 대상의 사전 확률과 추가적인 정보를 통해 해당 대상의 사후 확률을 추론하는 방법이다. 베이즈 추론은 베이즈 확률론을 기반으로 하며, 이는 추론하는 대상을 확률변수로 보아 그 변수의 확률분포를 추정하는 것을 의미한다. https://ko.wikipedia.org/wiki/%EB%B2%A0%EC%9D%B4%EC%A6%88_%EC%B6%94%EB%A1%A0 베이즈 추론 - 위키백과, 우리 모두의 백과사전 ko.wikipedia.org 2022. 3. 10.
728x90
반응형
LIST