728x90 반응형 SMALL 분산2 [Machine Learning] ExtraTree ExtraTree ExtraTrees는 기본적으로 의사결정나무를 기반으로 한 앙상블 학습 방법이다. RandomForest와 같은 ExtraTrees는 특정 결정과 데이터 하위 집합을 무작위로 지정하여 데이터의 과잉 학습과 과적합을 최소화한다. 트리 모델 비교 모델 분산 (Variance) 특징 Decision Tree 높음 단일 의사결정 트리는 일반적으로 하나의 의사결정 경로에서만 학습하기 때문에 학습 중인 데이터에 과적합된다. 단일 의사결정 트리를 통한 예측은 일반적으로 새 데이터에 대해 정확한 예측을 제공하지 않는다. Random Forest 중간 랜덤 포레스트 모델은 다음을 통해 무작위성을 도입하여 과적합 위험을 줄인다. 여러 트리 구축 (n_estimators) 교체를 통한 관찰 그리기(즉, 부.. 2024. 1. 3. 통계적 특징 통계적 특징 (Statistical features) 통계 기능은 다양한 지능형 신호 처리 응용 프로그램에서 사용되었다. 통계적 특징은 정보 기반 측정과 같은 다른 측정 외에 최대, 최소, 범위, 사분위수 범위, 중앙값, 최빈값 및 평균, 분산, 첨도 및 왜도와 같은 통계적 모멘트와 같은 통계적 특성 측면에서 데이터 모델링을 고려한다. 통계적 모멘트는 피처의 분포 속성에 대한 정보를 캡처할 수 있다. 무작위 변수 X의 샘플이 주어지면 기하학적 시리즈를 사용하여 차수 p의 원점에 대한 통계적 모멘트를 정의할 수 있다. 평균은 중심 경향의 척도이다. 중심 경향을 측정하기 위해 평균을 사용하면 이상치에 민감하기 때문에 때때로 오도될 수 있다. 모드 (가장 빈번한 데이터 값) 또는 중앙값 (데이터가 정렬될 때 .. 2022. 4. 27. 이전 1 다음 728x90 반응형 LIST