본문 바로가기
728x90
반응형
SMALL

GBM2

[Scikit-Learn] HistGradientBoostingClassifier sklearn.ensemble.HistGradientBoostingClassifier 이 추정기는 큰 데이터 세트(n_samples >= 10,000)에서 GradientBoostingClassifier보다 훨씬 빠르다. 이 추정기는 누락된 값 (NaN)을 기본적으로 지원한다. 훈련하는 동안 나무 재배자는 누락된 값이 있는 샘플이 잠재적 이득에 따라 왼쪽 또는 오른쪽 자식으로 이동해야 하는지 여부를 각 분할 지점에서 학습한다. 예측할 때 누락된 값이 있는 샘플은 결과적으로 왼쪽 또는 오른쪽 자식에 할당된다. 교육 중에 지정된 기능에 대해 누락된 값이 없으면 누락된 값이 있는 샘플은 가장 많은 샘플이 있는 하위 항목에 매핑된다. 결측치 처리 import numpy as np import pandas as .. 2023. 7. 5.
XGBoost XGBoost XGBoost는 매우 효율적이고 유연하며 이식가능 하도록 설계된 최적화된 분산 그라디언트 부스팅 라이브러리이다. Gradient Boosting 프레임워크 에서 기계 학습 알고리즘을 구현한다. XGBoost는 빠르고 정확한 방법으로 많은 데이터 과학 문제를 해결하는 병렬 트리 부스팅 (GBDT, GBM이라고도 함)을 제공한다. 동일한 코드가 주요 분산 환경 (Hadoop, SGE, MPI)에서 실행되며 수십억 개의 예제를 넘어선 문제를 해결할 수 있다. https://xgboost.readthedocs.io/en/stable/index.html XGBoost Documentation — xgboost 1.6.0 documentation © Copyright 2021, xgboost deve.. 2022. 5. 3.
728x90
반응형
LIST