본문 바로가기
728x90
반응형
SMALL

Gaussian Mixture Model2

[Speech Recognition] 레거시 음성 모델 (Legacy Acoustic Model) 레거시 음성 모델 (Legacy Acoustic Model) 은닉 마코프 모델 (Hidden Markov Model)과 가우시안 혼합 모델 (Gaussian Mixture Model) 조합의 음향 모델 (Acoustic Model)은 딥러닝 기반의 엔드투엔드 (end-to-end) 모델들이 등장하기 전 비교적 강력한 성능을 자랑했던 기존 음성 인식 시스템에서 언어 모델 (Language Model)과 더불어 중요한 역할을 수행했던 컴포넌트이다. HMM (Hidden Markov Model)  은닉 마코프 모델 (Hidden Markov Model)에서는 일반적으로 상태 전이에 대한 제약을 두지 않는다. 하지만, 은닉 마코프 모델을 음성 인식에 적용할 때는 left-to-right 제약을 둔다. 다시 말해.. 2024. 7. 3.
[Bayesian Inference] 가우스 혼합 모델 (Gaussian Mixture Model) 가우스 혼합 모델 (Gaussian Mixture Model) 가우스 혼합 모델 (GMM)에서 임의의 M 차원 pdf를 K < M인 K 가우스 밀도의 합으로 모델링한다. 널리 사용되지만 EM / GMM 알고리즘은 로컬 최소값으로 수렴하거나 입력 데이터의 특이성 또는 축퇴로 인해 실패할 수 있다. 또한 GMM은 "차원의 저주"를 겪는다. 입력 데이터의 차원이 증가함에 따라 평균 μk, k ∈ {1, 2, ..., K} 및 공분산 행렬 Σk는 기하급수적으로 증가한다. 매개변수 수가 기하급수적으로 증가하는 것을 막는 한 가지 방법은 공분산 행렬의 구조를 제한하는 것이다. 덜 과감한 해결책은 Gaussian의 혼합물 대신 확률적 PCA의 혼합물을 사용하는 것이다. 2022. 3. 28.
728x90
반응형
LIST