본문 바로가기
Data-driven Methodology/Resampling Methods

리샘플링 방법 (Resampling Methods)

by goatlab 2024. 1. 30.
728x90
반응형
SMALL

리샘플링 방법 (Resampling Methods)

 

https://www.kdnuggets.com/2023/02/role-resampling-techniques-data-science.html

 

리샘플링 방법은 현대 통계학에서 없어서는 안 될 도구이다. 이 방법은 훈련 세트에서 샘플을 반복적으로 추출하고 각 샘플에서 관심 있는 모델을 재추출하여 추정된 모델에 대한 추가 정보를 얻는다. 예를 들어, 선형 회귀식의 변동성을 추정하기 위해 훈련 데이터에서 여러 샘플을 반복적으로 추출하고 각각의 새로운 샘플에 선형 회귀식을 적용한 다음 결과값이 어느 정도 다른지 조사할 수 있다. 이러한 접근 방식을 사용하면 원래 학습 샘플을 사용하여 모델을 한 번만 프팅하면 얻을 수 없는 정보를 얻을 수 있다.

 

리샘플링 접근 방식은 훈련 데이터의 다른 하위 집합을 사용하여 동일한 통계적 방법을 여러 번 수행해야 하므로 계산 비용이 많이 들 수 있다. 그러나 최근 컴퓨팅 성능의 발전으로 인해 리샘플링 방법의 계산 요구 사항은 일반적으로 그리 높지 않다. 예를 들어, 교차 검증 (cross-validation)은 특정 통계 학습 방법과 관련된 테스트 오류를 추정하여 성능을 평가하거나 적절한 수준의 적합도를 선택하는 데 사용할 수 있다. 모델의 성능을 평가하는 과정을 모델 평가라고 하고, 모델에 적합한 수준의 적합도를 선택하는 과정을 모델 선택이라고 한다. 부트스트랩 (bootstrap)은 여러 가지 맥락에서 사용되며, 가장 일반적으로 매개변수 추정치 또는 주어진 통계적 학습 방법의 정확도를 측정하는 데 사용된다.

 

 

728x90
반응형
LIST