본문 바로가기
Learning-driven Methodology/ML (Machine Learning)

[Machine Learning] 클래스 가중치 (Class Weight)

by goatlab 2023. 9. 22.
728x90
반응형
SMALL

클래스 가중치 (Class Weight)

 

from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestClassifier

# 분류기와 파라미터 그리드 정의
classifier = RandomForestClassifier()
param_grid = {
    'class_weight': ['balanced', None],
    'max_depth': [3, 5, 10],
    'n_estimators': [80, 100, 150]
}

# GridSearchCV를 사용하여 최적의 파라미터 찾기
grid_search = GridSearchCV(classifier, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# 최적의 파라미터와 성능 출력
print("Best parameters:", grid_search.best_params_)
print("Best score:", grid_search.best_score_)

 

param_grid을 통해 불균형한 데이터에 가중치를 달리 적용하여 더 적은 클래스에 대해 모델이 잘 훈련할 수 있다.

 

https://scikit-learn.org/stable/modules/grid_search.html

 

3.2. Tuning the hyper-parameters of an estimator

Hyper-parameters are parameters that are not directly learnt within estimators. In scikit-learn they are passed as arguments to the constructor of the estimator classes. Typical examples include C,...

scikit-learn.org

 

728x90
반응형
LIST

'Learning-driven Methodology > ML (Machine Learning)' 카테고리의 다른 글

[Machine Learning] ExtraTree  (0) 2024.01.03
imbalanced-learn  (0) 2023.10.04
CatBoost  (0) 2023.07.12
[Machine Learning] Boosting Methods (3)  (0) 2023.07.11
[Machine Learning] Boosting Methods (2)  (0) 2023.07.11