728x90 반응형 SMALL 표준화2 [Data Science] 주성분 분석 (Principal Component Analysis, PCA) 주성분 분석 (Principal Component Analysis, PCA) 주성분 분석 (Principal Component Analysis, PCA)은 가장 널리 사용되는 차원 축소 기법 중 하나로, 원 데이터의 분포를 최대한 보존하면서 고차원 공간의 데이터들을 저차원 공간으로 변환한다. 데이터 집합을 새로운 좌표축으로 변환시키는 방법이다. 수 많은 정보의 홍수에서 이를 활용하기 위해 정보 손실을 최소화하면서 차수를 낮출 때 사용하는 방법이다. 정보를 각각 서로 간에 독립인 좌표축 들로 재구성하여, 최소한의 차원으로 최대한의 설명력을 높인다. n_components from sklearn.decomposition import PCA # PCA 모델을 생성 pca = PCA() # PCA 모델을 데이터.. 2023. 10. 30. [AI] 표준화 (Standardization) import matplotlib import pandas as pd from matplotlib import pyplot as plt df = pd.read_csv('./kaggle_diabetes.csv') df.head() df.hist() plt.tight_layout() plt.show() df['BloodPressure'].hist() plt.tight_layout() plt.show() df.info() df.isnull().sum() for col in df.columns: missing_rows = df.loc[df[col] == 0].shape[0] print(col + ": " + str(missing_rows)) import numpy as np # outlier 처리 df['Gluc.. 2022. 7. 24. 이전 1 다음 728x90 반응형 LIST