본문 바로가기
728x90
반응형
SMALL

Python Library180

[Pandas] 데이터프레임 만들기 데이터프레임 만들기 import pandas as pd import numpy as np csv_data = '''\ 구분,죄종,발생검거,건수 중부,살인,발생,3 중부,살인,검거,2 중부,강도,발생,8 중부,강도,검거,8 중부,사기,발생,143 중부,사기,검거,105 ''' with open('중부 지역 강력 사건 발생 검거 통계.csv', 'w', encoding='UTF-8') as f: f.write(csv_data) df = pd.read_csv('중부 지역 강력 사건 발생 검거 통계.csv') pd.pivot_table(df, index=['죄종', '발생검거'], aggfunc=np.sum) 2022. 10. 26.
[Pandas] 타이타닉 생존자 분석 타이타닉 생존자 분석 https://www.kaggle.com/datasets/tedllh/titanic-train에서 csv 파일을 다운한다. import numpy as np import pandas as pd import matplotlib.pyplot as plt titanic_df = pd.read_csv('titanic_train.csv') titanic_df titanic_df['Survived'].groupby(titanic_df['Sex']).mean() Sex female 0.742038 male 0.188908 Name: Survived, dtype: float64 titanic_df.pivot_table(index=['Sex'])['Survived'] Sex female 0.7420.. 2022. 10. 25.
[Pandas] Iris (붓꽃) Iris (붓꽃) 비짜루목 붓꽃과 붓꽃속에 속하는 여러해 살이 풀 또는 그 식물의 꽃을 말한다. 꽃봉오리가 먹을 묻힌 붓과 같이 생겼다 하여 붙여진 이름이다. import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn import datasets iris = datasets.load_iris() irisdt = pd.DataFrame(iris['data'], columns=iris['feature_names']) irisdt plt.scatter(irisdt['sepal length (cm)'], irisdt['sepal width (cm)'], c=iris.target) for f0 in iris['feature.. 2022. 10. 25.
[Pandas] 시각화 시각화 import numpy as np import pandas as pd import matplotlib.pyplot as plt se0 = pd.Series(np.random.randn(100).cumsum()) se0.plot() df = pd.DataFrame(np.random.randn(100, 5).cumsum(0), columns= ['arr1', 'arr2', 'arr3', 'arr4', 'arr5'] ) df.plot() 막대 그래프 se0.plot(kind='bar') df.plot(kind='bar') # 가로 바 차트 se0.plot(kind='barh') df.plot(kind='barh') df.plot(kind='bar', stacked=True) 히스토그램 값의 빈도를 분리.. 2022. 10. 23.
[Pandas] HTML 파일에서 데이터 입출력 HTML 파일에서 데이터 입출력 import pandas as pd import numpy as np naver_finance_url = "https://finance.naver.com/" html_dfs = pd.read_html(naver_finance_url, encoding = 'euc-kr') print("TOP 종목") html_dfs[0] # table의 개수 len(html_dfs) 12 # html 저장 html_dfs[0].to_html('naver_finance.html') 2022. 10. 21.
[Pandas] 폴더 안에 있는 여러 개의 csv 파일 합치기 폴더 안에 있는 여러 개의 csv 파일 합치기 import pandas as pd from glob import glob # 폴더 내의 모든 csv파일 목록 불러오기 file_names = glob("/data/*.csv") # 빈 데이터프레임 하나 생성 total = pd.DataFrame() #빈 데이터프레임 하나를 생성 for file_name in file_names: # csv파일을 하나씩 열어 임시 데이터프레임으로 생성 temp = pd.read_csv(file_name, sep = ',', encoding = 'utf-8') #전체 데이터프레임에 추가하여 넣음 total = pd.concat([total, temp]) total.to_csv("/data/total.csv") df = pd.r.. 2022. 10. 20.
[Pandas] shuffle shuffle pandas에서 데이터를 섞어주는 함수가 존재한다. df # row 전체 shuffle df = df.sample(frac = 1) df # shuffling하고 index reset df = df.sample(frac = 1).reset_index(drop = True) df 2022. 10. 17.
[HeartPy] Colorblind mode (2) Colorblind mode # Now let's do colorblind protanopia friendly palettes hp.config.colorblind = True hp.config.colorblind_type = 'tritanopia' for palette in palettes: hp.config.color_style = palette hp.plot_poincare(wd, m, title='color palette: %s' %palette) import matplotlib.pyplot as plt data, timer = hp.load_exampledata(1) fs = hp.get_samplerate_mstimer(timer) wd, m = hp.process(data, 100.0, cl.. 2022. 8. 25.
[HeartPy] Colorblind mode (1) Colorblind mode 1.2.4 이후로 HeartPy는 colorbilnd 모드가 플롯 API에 구현되어 있다. 여러 가지 다른 스타일을 사용할 수 있으며, deuteranopia (제2 색맹), protanopia (제 1색맹), tritanopia (제 3색맹)에 대한 지원이 가능하다. heartpy.config를 통해 쉽게 사용할 수 있다. heartpy.config.colorblind_type 지원하려는 colorbilnd 유형으로 설정한다. deuteranopia (default) protanopia tritanopia heartpy.config.color_style 원하는 색깔을 지정한다. default (default) retro elegant corporate zesty # load.. 2022. 8. 25.
[HeartPy] Noisy ECG 신호 분석 (2) Noisy ECG 신호 분석 작동은 정상이지만, 일부 거부에는 하면 안 되는 부분이 있다 (올바른 피크가 잘못된 것으로 표시됨). 심전도에는 일반적으로 매우 좁은 피크가 있다. 필터링은 일반적으로 최대값을 같은 위치에 유지하지만 파형을 더 좁혀 문제를 일으킬 수 있다. HeartPy는 훨씬 더 넓은 PPG 파형을 위해 설계되었기 때문에 업샘플링은 일반적으로 피크당 더 많은 데이터 포인트를 제공하기 때문에 트릭을 수행한다. 상대 피크 위치를 이동하거나 변경하지 않는다. from scipy.signal import resample resampled_signal = resample(filtered, len(filtered) * 4) wd, m = hp.process(hp.scale_data(resampled_.. 2022. 8. 25.
728x90
반응형
LIST