본문 바로가기
728x90
반응형
SMALL

AI-driven Methodology/Artificial Intelligence22

[AI] 평가 모델 (3) Mean Error MSE, MAE 및 RMSE는 회귀 분석에서 예측 오류율과 모델 성능을 평가하는 데 주로 사용된다. MAE (Mean Absolute Error) MAE (평균 절대 오차)는 데이터 세트에 대한 평균 절대 차이에 의해 추출된 원래 값과 예측 값 사이의 차이를 나타낸다. from sklearn.metrics import median_absolute_error y_true = [3, 5, 7] y_pred = [0, 4, 9] median_absolute_error(y_true, y_pred) 2.0 MSE (Mean Squared Error) MSE (평균 제곱 오차)는 데이터 집합에 대한 평균 차이를 제곱하여 추출한 원래 값과 예측 값의 차이를 나타낸다. from sklearn.met.. 2022. 9. 27.
[AI] 평가 모델 (2) Precision Precision은 올바르게 분류된 양성 예수의 수를 양성으로 분류된 예수의 총 수로 나눈 값이다. Recall Recall은 올바르게 분류된 양성 예제의 수를 검정 세트에서 실제 양성 예제의 총 수로 나눈 값이다. F1 Score 두 가지 측도를 사용하여 두 분류자를 비교하는 것은 어렵다. F1 점수는 precision과 recall을 하나의 척도로 결합한다. 두 숫자의 조화 평균은 둘 중 작은 숫자에 더 가까운 경향이 있다. F1 값이 크면 p와 r이 모두 크다. import numpy as np from sklearn.metrics import precision_score from sklearn.metrics import recall_score from sklearn.metrics.. 2022. 9. 27.
[AI] 평가 모델 (1) 평가 모델 머신러닝에서 각각의 알고리즘이 특성, 차이가 있기 때문에 모델을 평가할 지표가 필요하다. 평가 모델은 다음과 같다. 정확도 예측 (Predictive accuracy) 호율 (Efficiency) : 모델을 구성하는 시간, 모델을 사용하는 시간 완건성 (Robustness) : noise 및 결측값 처리 확장성 (Scalability) : disk 상주 데이터베이스의 효율성 해석 가능성 (Interpretability) : 모델에서 제공하는 이해 및 통찰력 모델 소형화 (Compactness of the model) : 트리의 크기 또는 규칙 수 데이터 분리 훈련 / 테스트 분할 (train / test split)은 머신러닝에서 데이터를 학습을 하기 위한 학습 데이터셋 (train datas.. 2022. 9. 27.
[AI] 인공지능의 역사 (주요 응용 분야) (4) 전문가 시스템 (Expert System) 특정 문제 영역에 대해 전문가 수준의 해법을 제공하는 것이다. 간단한 제어시스템에서부터 복잡한 계산과 추론을 요구하는 의료 진단, 고장 진단, 추천 시스템이 있다. 작업 중요도 높은 분야의 경우 추천 정보로 활용 ⁃ 최종 결정은 현장 작업자가 담당 ⁃ 원자력 발전소, 항공우주 분야 등 지식 표현과 추론 부분 분리하여 구성 ⁃ 지식만 변경하면 변화하는 환경에 쉽게 대응 규칙기반 시스템 (rule-based system)을 통한 구현 데이터 마이닝 (Data Mining) 실제 대규모 데이터에서 암묵적인, 이전에 알려지지 않은, 잠재적으로 유용할 것 같은 정보를 추출하는 체계적인 과정을 말한다. 기계학습, 통계학 기법 적용 연관 규칙. 분류 패턴, 군집화 패턴, 텍.. 2022. 9. 17.
[AI] 인공지능의 역사 (3) 빅데이터와 인공지능 구분 1세대 2세대 3세대 4세대 기술 OLTP OLAP/DW 빅데이터 AI 년도 ~1999 2000 2007 2016~ 대상 정형 정형 (다차원) 정형-비정형 지능화 데이터 머신러닝 파이프 라인 인공지능을 구성하는 핵심 요소 ① 학습 모델 신경망, 머신러닝, 다층 퍼셉트론, 전문가 시스템 등 ② 하드웨어와 소프트웨어 GPU, SPARK와 같은 병렬처리 장치와 텐서플로우 등 ③ 학습과 실행에 사용되는 프로그래밍 언어 Python, C, Lisp, Prolog 등 ④ 응용 분야 음성인식, 영상인식, 챗봇, 자연어 처리, 지식 처리 등 인공지능 핵심 기술 : 탐색 (Search) 문제의 답이 될 수 있는 것들의 집합을 공간 (space)으로 간주하고, 문제에 대한 최적의 해를 찾기 위해 .. 2022. 9. 17.
[AI] 인공지능의 역사 (2) 인공지능의 발전 1960년대 이전 1946년 펜실베니아 대학에서 ENIAC 개발 ⁃ 큰 기대와 여러 가지 시도, 매우 제한된 성공 LISP 언어 개발 (매커시, 1958) ⁃ 논리 기반 지식표현 및 추론 퍼셉트론 (Perceptron) 모델 (로젠블랏, 1958) ⁃ 초기 신경망 모델 수단-목표 분석 (means-ends analysis) 기법 (Newell & Simon, 1958) ⁃ 범용 문제해결을 목표로 한 GPS (General Problem Solver) 개발 수단-목표 분석 (means-ends analysis)은 해결해야 하는 문제를 상태 (state)로 정의한다. 현재 상태와 목적 상태 (goal state) 간의 차이 계산하고 목적 상태로 도달하기 위한 조작자 (operator, 연산자.. 2022. 9. 15.
[AI] 인공지능의 역사 (1) 인공지능 (Artificial Intelligence) 다트머스 회의 (Dartmouth Conference,1956)에서 존 마카시 (John McCarthy)가 AI 용어를 처음 제안했다. 인공지능의 정의는 기준에 따라 다양하다. 사람의 생각과 관련된 활동, 예를 들면 의사 결정, 문제 해결, 학습 등의 활동을 자동화하는 것 (벨만, Bellman, 1978) 사람이 하면 더 잘 할 수 있는 일을 컴퓨터가 하도록 하는 방법을 찾는 학문 (리치와 나이트, Rich & Knight, 1991) 인지하고, 추론하고, 행동할 수 있도록 하는 컴퓨팅에 관련된 학문 (윌슨 Wilson, 1992) 컴퓨터를 사용하여 인간의 지능을 모델링하는 기술 인간과 같이 인식, 사고, 학습 활동 방법 등을 연구하는 분야 인공.. 2022. 9. 15.
[AI] 정확도 (Accuracy) / 손실 (Loss) 정확도 (Accuracy) 정확도는 분류 모델의 성능을 측정하는 방법이다. 전체 데이터에 대한 예측 오류의 수로 볼 수 있다. 쉽게 말해, 전체 데이터 중에서 몇 개를 맞췄는가이다. 일반적으로 백분율로 표시된다. 정확도는 예측 값이 실제 값과 동일한 예측 횟수이다. 특정 샘플에 대한 바이너리 (true/false)이다. 정확도는 종종 전체 또는 최종 모델 정확도와 관련되지만 교육 단계에서 그래프로 표시되고 모니터링된다. 정확도는 손실보다 해석하기 쉽다. 손실 (Loss) 실제 정답과 모델이 예측 한 값 사이의 차이 (거리 또는 오차)이다. 비용 함수라고도 하는 손실 함수는 예측이 실제 값과 얼마나 다른지에 따라 예측의 확률 또는 불확실성을 고려한다. 이것은 모델이 얼마나 잘 수행되고 있는지에 대한 보다 .. 2022. 8. 18.
[AI] 콜백 (Callback) 콜백 (Callback) TensorFlow 콜백(callback)은 모델의 학습 방향, 저장 시점, 학습 정지 시점 등에 관한 상황을 모니터링 하기 위해 주로 사용된다. 모델이 학습을 시작하면 학습이 완료될 때까지 수행할 것이 없다. 따라서, 이를 해결하고자 존재하는 것이 콜백 함수이다. 예를 들어, 학습 도중에 학습율 (learning rate)을 변화시키거나 val_loss가 개선되지 않으면 학습 도중에 학습을 멈추게 하는 등의 작업을 할 수 있다. TensorFlow에서 사용되는 대표적인 콜백 함수는 ReduceLROnPlateau, ModelCheckpoint, EarlyStopping 등이 있다. ReduceLROnPlateau 모델의 성능 개선이 없을 경우, 학습율 (Learning Rate.. 2022. 7. 31.
[AI] 와인 종류 예측 와인 종류 : red, white 두가지 타입으로 예측 import pandas as pd # 데이터 로드 # 원본 파일은 분리자가 세미콜론 red_df = pd.read_csv('./winequality-red.csv', sep=';') white_df = pd.read_csv('./winequality-white.csv', sep=';') # 분리자를 콤마로 사본 저장 (일반적으로 csv 파일은 세미콜론이 아닌 콤마로 분리자를 사용) red_df.to_csv('./winequality-red2.csv', index=False) white_df.to_csv('./winequality-white2.csv', index=False) red_df = pd.read_csv('./winequality-red2... 2022. 7. 24.
728x90
반응형
LIST