본문 바로가기
728x90
반응형
SMALL

분류 전체보기1626

[Pandas] 시각화 시각화 import numpy as np import pandas as pd import matplotlib.pyplot as plt se0 = pd.Series(np.random.randn(100).cumsum()) se0.plot() df = pd.DataFrame(np.random.randn(100, 5).cumsum(0), columns= ['arr1', 'arr2', 'arr3', 'arr4', 'arr5'] ) df.plot() 막대 그래프 se0.plot(kind='bar') df.plot(kind='bar') # 가로 바 차트 se0.plot(kind='barh') df.plot(kind='barh') df.plot(kind='bar', stacked=True) 히스토그램 값의 빈도를 분리.. 2022. 10. 23.
[Pandas] HTML 파일에서 데이터 입출력 HTML 파일에서 데이터 입출력 import pandas as pd import numpy as np naver_finance_url = "https://finance.naver.com/" html_dfs = pd.read_html(naver_finance_url, encoding = 'euc-kr') print("TOP 종목") html_dfs[0] # table의 개수 len(html_dfs) 12 # html 저장 html_dfs[0].to_html('naver_finance.html') 2022. 10. 21.
[ANN] GRU으로 삼성전자 주가 예측 GRU으로 삼성전자 주가 예측 yahoo finance에서 데이터 다운로드 후 3일 (3MA), 5일 (5MA) 가격이평선 추가한다. import tensorflow as tf import numpy as np import pandas as pd import matplotlib.pyplot as plt from tensorflow.keras.models import Sequential from tensorflow.keras.layers import GRU, Dense, Dropout # yahoo finance로부터 데이터 다운로드 raw_df = pd.read_csv('./000000.KS_3MA_5MA.csv') raw_df.head() plt.title('SAMSUNG ELECTRONIC STCOK.. 2022. 10. 21.
[ANN] LSTM으로 삼성전자 주가 예측 LSTM으로 삼성전자 주가 예측 yahoo finance에서 데이터 다운로드 후 3일 (3MA), 5일 (5MA) 가격이평선 추가한다. import tensorflow as tf import numpy as np import pandas as pd import matplotlib.pyplot as plt from tensorflow.keras.models import Sequential from tensorflow.keras.layers import LSTM, Dense, Dropout # yahoo finance로부터 데이터 다운로드 raw_df = pd.read_csv('./000000.KS_3MA_5MA.csv') raw_df.head() plt.title('SAMSUNG ELECTRONIC STC.. 2022. 10. 21.
[ANN] SimpleRNN (2) 데이터 전처리 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from tensorflow.keras.layers import SimpleRNN, LSTM, Dense from tensorflow.keras import Sequential # data 생성 x = np.arange(0, 100, 0.1) y = 0.5*np.sin(2*x) - np.cos(x/2.0) seq_data = y.reshape(-1,1) print(seq_data.shape) print(seq_data[:5]) (1000, 1) [[-1. ] [-0.89941559] [-0.80029499] [-0.70644984] [-0.62138853]].. 2022. 10. 21.
[Pandas] 폴더 안에 있는 여러 개의 csv 파일 합치기 폴더 안에 있는 여러 개의 csv 파일 합치기 import pandas as pd from glob import glob # 폴더 내의 모든 csv파일 목록 불러오기 file_names = glob("/data/*.csv") # 빈 데이터프레임 하나 생성 total = pd.DataFrame() #빈 데이터프레임 하나를 생성 for file_name in file_names: # csv파일을 하나씩 열어 임시 데이터프레임으로 생성 temp = pd.read_csv(file_name, sep = ',', encoding = 'utf-8') #전체 데이터프레임에 추가하여 넣음 total = pd.concat([total, temp]) total.to_csv("/data/total.csv") df = pd.r.. 2022. 10. 20.
[ANN] SimpleRNN (1) SimpleRNN SimpleRNN 레이어는 가장 간단한 형태의 RNN 레이어이며 기본 구조는 다음과 같다. Xt-1, Xt, Xt+1은 입력데이터를 나타내고 Ht-1, Ht, Ht+1은 은닉층 개념의 SimpleRNN 레이어 출력값을 Yt-1, Yt, Yt+1은 출력층의 출력값을 나타낸다. 학습 대상의 가중치는 입력층과 은닉층 사이의 가중치 Wih, 시간 t에서의 은닉층과 시간 t+1에서의 은닉층 간의 가중치 Whh, 은닉층과 출력층 사이의 가중치 Who로 구성된다. 시간 t에서 은닉층 SimpleRNN 레이어 출력은 Ht = tanh(XtWih + Ht-1Whh)이다. 구조 시계열 데이터를 이용해서 미래 값을 예측하는 RNN 구조는 w, h 등을 설정하여 일정한 길이로 패턴을 잘라서 학습 데이터를 만.. 2022. 10. 19.
[Python] 딕셔너리를 활용한 IP 변환 딕셔너리를 활용한 IP 변환 도메인이나 IP를 입력하면 ip-api.com로 접속해서 정보를 정리해주는 프로그램을 구현 가능하다. # 웹 요청을 수행하는 라이브러리 설치 !pip install requests import requests # 웹 요청을 수행하는 라이브러리 import json # json을 dict으로 변환하는 라이브러리 ip = input("도메인이나 IP를 입력 : ") res = requests.get(f'http://ip-api.com/json/{ip}') # Get 요청 수행 geo_data = json.loads(res.text) # 바디 데이터를 json에서 dict으로 변경 # print(type(geo_data)) # 데이터 타입 확인 #geo_data # 데이터 확인 p.. 2022. 10. 19.
[Pandas] shuffle shuffle pandas에서 데이터를 섞어주는 함수가 존재한다. df # row 전체 shuffle df = df.sample(frac = 1) df # shuffling하고 index reset df = df.sample(frac = 1).reset_index(drop = True) df 2022. 10. 17.
[IDE] 스파이더 (spyder) 스파이더 (spyder) Spyder는 Python으로 작성되었으며 과학자, 엔지니어 및 데이터 분석가가 설계한 무료 오픈 소스 과학 환경이다. 이는 포괄적인 개발 도구의 고급 편집, 분석, 디버깅 및 프로파일링 기능과 과학 패키지의 데이터 탐색, 대화식 실행, 심층 검사 및 아름다운 시각화 기능을 고유하게 조합한 것을 특징으로 한다. https://www.spyder-ide.org/ Home — Spyder IDE Download Ready to give Spyder a try? Let's get started! Want to join the community of scientists, engineers and analysts all around the world using Spyder? Click t.. 2022. 10. 13.
728x90
반응형
LIST