728x90 반응형 SMALL outlier3 [Machine Learning] 이상 탐지 (Anomaly Detection) 이상 탐지 (Anomaly Detection) 변칙은 데이터 세트의 예상된 패턴에서 예상치 못한 변화 또는 편차이다. 이상 탐지는 이상 징후가 예상과 다르게 발생하고 있음을 보여주기 때문에 비정상적인 동작을 경고하는 데 사용된다. 이상 징후가 반드시 좋거나 나쁜 것은 아니지만, 기업은 패턴의 단절에 대해 알아야 조치를 취할 필요가 있는지 여부를 평가할 수 있다. 기업은 일상적인 운영 중에 수백만 개의 데이터 포인트를 생성하지만, 그 중요한 정보의 대부분은 사용되지 않고 잊혀진다. 이러한 이유로 비즈니스 세계에서 이상 탐지 기능이 점점 더 부각되고 있다. 즉, 운영을 최적화하고 프로세스를 간소화하여 보다 예측 가능한 미래를 실현하는 것이다. Anomalies와 Outliers의 차이 많은 비즈니스 사용자들.. 2022. 11. 17. [Data Science] 이상치 처리 이상치 (Outlier) 극단적으로 값이 크거나 작은 값을 말한다. 데이터 오기입 혹은 특이 현상을 칭한다. 당뇨병 데이터셋 ➢ Pregnancies : 임신 횟수 ➢ Glucose : 포도당 부하 검사 수치 ➢ BloodPressure : 혈압 ➢ SkinThinkness : 삼두근 피부 두께 ➢ Insulin : 인슐린 수치 ➢ BMI : BMI 수치 ➢ DiabetesPedigreeFunction : 당뇨병 가족력 ➢ Age : 나이 ➢ Outcome : 당뇨병 여부 import numpy as np import pandas as pd df = pd.read_csv('Diabetes_Database.csv') for key in ["Glucose","BloodPressure","SkinThickne.. 2022. 9. 26. [HeartPy] Noisy ECG 신호 분석 (1) Noisy ECG 신호 분석 HeartPy를 사용하여 특히 노이즈가 많은 심전도 신호를 분석하는 방법이 있다. 심전도 분석에서 전처리 단계는 피크 형태에 차이가 있기 때문에 PPG 신호와 약간 다르지만 일반적인 분석은 동일한 방식으로 처리된다. MIT-BIH Noise 스트레스 테스트 데이터 세트의 데이터를 사용한다. 이 데이터는 wfdb 패키지와 함께 로드되어야 하지만, 사용하기 쉽도록 4개의 파일을 .csv 데이터로 변환했다. 모든 파일이 360Hz로 기록된다. SNR (Signal-to-Noise) 비율이 다양한 다음 파일을 사용한다. 118e24 : SNR : 24dB 118e12 : SNR = 12dB 118e06 : SNR = 6dB 118e00 : SNR = 0dB 이 파일에는 잡음 섹션과 .. 2022. 8. 25. 이전 1 다음 728x90 반응형 LIST