728x90
반응형
SMALL
분류 (Classification)
supervised ML의 문제의 타입 (problem type)에 따라 크게 두가지로 분류될 수 있다.
|
Classification은 주어진 데이터를 정해진 카테고리에 따라 분류하는 문제를 말한다. 최근에 많이 사용되는 이미지 분류도 Classification 중에 하나이다.
예를 들어, 이메일이 스팸메일인지 아닌지를 예측하려고 하면 이메일은 "스팸메일 / 정상적인 메일"로 라벨링 될 수 있을 것이다. 비슷한 예시로 암을 예측하려고 가정했을 때 이 종양이 "악성종양인지 / 아닌지"로 구분할 수 있다. 이처럼 맞다/아니다로 구분되는 문제를 Binary Classification이라고 부른다.
분류 문제가 모두 "맞다 / 아니다"로 구분되지는 않는다. 예를 들어, 공부시간에 따른 전공 "Pass / Fail"을 예측하려고 하면 이는 Binary Classification 으로 볼 수 있다. 반면에, 수능 공부시간에 따른 전공 학점을 A / B / C / D / F 으로 예측하는 경우도 있다. 이러한 분류를 Multi-label Classification이라고 한다.
Regression은 연속된 값을 예측하는 문제를 말한다. 주로 어떤 패턴이나 트렌드, 경향을 예측할 때 사용된다. Coursera에서는 Regression을 설명할 때 항상 집의 크기에 따른 매매가격을 예로 든다. 아까와 유사한 예를 들면, 공부시간에 따른 전공 시험 점수를 예측하는 문제를 예로 들 수 있다.
728x90
반응형
LIST
'Learning-driven Methodology > ML (Machine Learning)' 카테고리의 다른 글
[Machine Learning] SHAP (SHapley Additive exPlanations) (0) | 2022.05.03 |
---|---|
[Machine Learning] MNIST (0) | 2022.04.28 |
[Machine Learning] 경사하강법 (Gradient Descent) (0) | 2022.04.28 |
20. 모델 평가 방법 (0) | 2021.12.22 |
19. 시계열분석 (Time Series Analysis) (0) | 2021.12.22 |