728x90
반응형
SMALL
머신러닝 : 컴퓨터가 데이터를 통해 유의미한 패턴과 통계적인 함수를 발견하여 행동의 지침이 되는 지식을 얻어내는 행위
회귀 : 입력데이터를 바탕으로 원하는 타겟변수의 미래결과 예측
분류 : 개별 데이터의 class를 예측하거나 계급 결정 (스팸 필터링, 사기방지)
추천 : 상품 혹은 그 대안 예측
대체 : 누락된 입력데이터의 값 보강
ML workflow : 실데이터를 통한 모델이 안정화될 때까지
- 기존 데이터
- EDA : 특성 추출, 훈련 검증 테스트 분리
- 모델링 : 모델구축 모델평가 모델최적ㅈ화
- 신규 데이터로 예측 -> 피드백
방법론
- 지도학습 : 훈련 데이터 안에 예측해야 할 target이 있는 경우, 오브젝트 디텍션
- 비지도학습 : target이 없는 경우, 함수모형을 만들지 않고 데이터 패턴 추출, 데이터 숨겨진 구조 찾음
- 강화학습 : 데이터가 스스로 정답을 찾기 위해서 환경과 상호작용함, target 값을 만들면서 훈련하는 학습, 해답에서 멀어질수록 벌점이 부과되는 성질 이용, 풀려고 하는 문제를 게임으로 간주하여 작용
구현 방법
- 데이터 가공 및 전처리 (작업의 거의 절반이상), munging(가공), wrangling(보강)
: 데이터 미싱이 있기 떄문
- 훈련 데이터 추출
- 모델 평가(실제값과 예측값의 비교)
- 모델의 매개변수 조정 : 특성 변수를 찾는 과정 포함
센서 데이터 분석? : outlier detection 알고리즘, 어떤 센서가 고장났는지 확인 가능
평균 값에서 심하게 벗어난 데이터 확인
Ai 챗봇
728x90
반응형
LIST
'Learning-driven Methodology > ML (Machine Learning)' 카테고리의 다른 글
06. 나이브 베이즈 (Naive Bayes) (0) | 2021.12.15 |
---|---|
06. KNN (K-Nearest Neighbor) (0) | 2021.12.08 |
04. 군집 분석 (Clustering) (0) | 2021.12.08 |
03. 회귀분석 (Regression Analysis) (0) | 2021.12.08 |
02. 의사결정 트리 (Decision Tree) (0) | 2021.12.08 |