본문 바로가기
728x90
반응형
SMALL

Missing Data4

[ANN] GRU으로 삼성전자 주가 예측 GRU으로 삼성전자 주가 예측 yahoo finance에서 데이터 다운로드 후 3일 (3MA), 5일 (5MA) 가격이평선 추가한다. import tensorflow as tf import numpy as np import pandas as pd import matplotlib.pyplot as plt from tensorflow.keras.models import Sequential from tensorflow.keras.layers import GRU, Dense, Dropout # yahoo finance로부터 데이터 다운로드 raw_df = pd.read_csv('./000000.KS_3MA_5MA.csv') raw_df.head() plt.title('SAMSUNG ELECTRONIC STCOK.. 2022. 10. 21.
[ANN] LSTM으로 삼성전자 주가 예측 LSTM으로 삼성전자 주가 예측 yahoo finance에서 데이터 다운로드 후 3일 (3MA), 5일 (5MA) 가격이평선 추가한다. import tensorflow as tf import numpy as np import pandas as pd import matplotlib.pyplot as plt from tensorflow.keras.models import Sequential from tensorflow.keras.layers import LSTM, Dense, Dropout # yahoo finance로부터 데이터 다운로드 raw_df = pd.read_csv('./000000.KS_3MA_5MA.csv') raw_df.head() plt.title('SAMSUNG ELECTRONIC STC.. 2022. 10. 21.
[Data Science] 결측치 처리 (1) 결측치 (Missing Data) 다른 항목 측정 시 측정되지 않거나, 네트워크 문제로 인해 누락된 값을 말한다. 데이터마다 측정되는 항목 또한 상이하다. 결측치 처리 삭제 특정 행의 데이터를 삭제하거나 결측치가 많은 특징을 삭제한다. 보간 평균값, 최빈값, 중간값 보간 시 훈련 데이터 (training data)를 기준으로 계산하여 검증 데이터 (validation data)나 테스트 데이터 (test data)에 적용 당뇨병 데이터 전처리 import numpy as np import pandas as pd df = pd.read_csv('Diabetes_Database.csv') df.head() 결측치 확인 print(df.isnull().sum()) Pregnancies 0 Glucose 0 B.. 2022. 9. 24.
[Bayesian Inference] 사후 분포 (A Posterior Distribution) 사후 분포 (A Posterior Distribution) 베이지안 추론은 데이터 y를 고려한 후 매개변수 θ의 모든 가능한 값의 확률을 조사하여 도출된다. 하이퍼파라미터 λ가 알려지거나 추정되면 Bayes의 정리를 적용하여 사후 pdf를 얻는다. 분모 p(y | I) = p(y | θ, I) π (θ | λ, I)dθ는 증거로 알려져 있으며 p(θ | y, I) 하나로 통합된다. 결합 분포에서 관측 데이터 y를 제외한 모든 변수를 통합하여 증거를 얻는다. 하이퍼파라미터 λ를 모르는 경우 통합을 통해 이를 제거할 수도 있다. 여기서 π(λ | I)는 λ이다. 주어진 데이터 y에서 θ에 대한 지식을 어떻게 체계적으로 업데이트할 수 있는지 알려준다. 예를 들어, 관측값이 한 번에 하나씩 얻어지면 다음과 같이.. 2022. 3. 28.
728x90
반응형
LIST