본문 바로가기
728x90
반응형
SMALL

python84

[Matplotlib] 눈금 시간 설정 눈금 시간 설정 데이터프레임에서 str 타입의 시간을 축으로 사용하기 위해 pd.to_datetime() 함수를 사용한다. 이 함수를 사용하여 문자열을 datetime64 형식으로 변환하고 데이터프레임의 x축으로 사용할 수 있다. df['Time'] = pd.to_datetime(df['time']) import matplotlib.pyplot as plt import matplotlib.dates as mdates fig, ax = plt.subplots() ax.plot(df['Time'], df['Value']) ax.set_xlabel('Time') ax.set_ylabel('Value') ax.set_title('Time vs Value') # x축 눈금 간격 설정 (1시간 간격으로 눈금 표시).. 2023. 7. 28.
타겟 인코딩 (Target Encoding) Removing the First Level pd.concat 함수에는 drop_first라는 매개 변수도 포함되어 있는데, 첫 번째 수준을 제거함으로써 k-1 더미를 k개의 범주형 수준에서 벗어나게 할지 여부를 지정한다. 이 경우 첫 번째 수준인 area_a를 제거하고자 하는 이유는 보통 사용되지 않는 [0,0,0]의 인코딩을 사용함으로써 더 효율적인 인코딩을 제공한다. area를 단지 세 개의 열로 인코딩하고 a의 범주형 값을 [0,0,0]으로 매핑한다. import pandas as pd dummies = pd.get_dummies(['a', 'b', 'c', 'd'], prefix = 'area', drop_first = True) print(dummies) 위의 데이터에서 볼 수 있듯이 area.. 2023. 7. 27.
원핫 인코딩 (One-Hot-Encoding) Encoding Categorical Values as Dummies 범주형 값을 부호화하는 전통적인 방법은 더미 변수로 만드는 것이다. 이 기법은 one-hot-encoding이라고도 한다. csv를 다운 받는다. import pandas as pd df = pd.read_csv('jh-simple-dataset.csv', na_values = ['NA', '?']) pd.set_option('display.max_columns', 7) pd.set_option('display.max_rows', 5) display(df) area 열은 숫자가 아니므로 원핫 인코딩으로 인코딩해야 한다. 영역 수와 개별 값을 표시한다. 이 경우 영역 범주형 변수에는 4개의 값만 있다. areas = list(df['ar.. 2023. 7. 27.
Dropping / Concatenating Dropping Fields 값이 없는 필드를 신경망에 삭제해야 한다. 다음 코드는 MPG 데이터 세트에서 이름 열을 제거한다. import os import pandas as pd df = pd.read_csv('auto-mpg.csv', na_values = ['NA', '?']) print(f"Before drop : {list(df.columns)}") df.drop('name', 1, inplace=True) print(f"After drop : {list(df.columns)}") Before drop : ['mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'year', 'origin', 'name'] Aft.. 2023. 7. 27.
statsmodels statsmodels statsmodels는 통계 모델에 대한 기술 통계 및 추정 및 추론을 포함하여 통계 계산을 위해 scipy를 보완하는 Python 패키지이다. python -m pip install statsmodels Main Features 선형 회귀 모델 일반 최소 제곱 일반화된 최소 제곱 가중 최소제곱 자기회귀 오류가 있는 최소제곱 분위수 회귀 재귀적 최소제곱 효과 및 분산 성분이 혼합된 혼합 선형 모델 GLM: 모든 단일 매개변수 지수군 분포를 지원하는 일반화 선형 모델 이항 및 푸아송을 위한 베이지안 혼합 GLM GEE: 단방향 클러스터 또는 종단 데이터에 대한 일반화된 추정 방정식 개별 모델 로짓과 프로빗 다항 로짓 (MNLogit) 포아송 및 일반화 포아송 회귀 음이항 회귀 제로 팽.. 2023. 7. 18.
CatBoost CatBoost CatBoost는 Yandex에서 개발한 오픈 소스 소프트웨어 라이브러리이다. 이는 다른 기능 중에서 클래식 알고리즘과 비교하여 순열 기반 대안을 사용하여 범주형 기능을 해결하려고 시도하는 그레디언트 부스팅 프레임워크를 제공한다. pip install catboost import numpy from catboost import CatBoostRegressor dataset = numpy.array([[1,4,5,6], [4,5,6,7], [30,40,50,60], [20,15,85,60]]) train_labels = [1.2, 3.4, 9.5, 24.5] model = CatBoostRegressor(learning_rate=1, depth=6, loss_function='RMSE') .. 2023. 7. 12.
[SciPy] 영 위상 필터 (Zero-Phase Filter) 영 위상 필터 (Zero-Phase Filter) 영 위상 필터 (Zero-Phase Filter)는 신호 처리에서 사용되는 필터 중 하나이다. 이 필터는 신호를 두 번 처리하여 위상 지연을 제거하는 방법으로 작동한다. 영 위상 필터는 전체적인 신호의 위상을 유지하면서 주파수 응답을 변형시키는 필터이다. 이 필터는 주로 신호 처리에서 사용되며, 신호의 위상이 중요한 경우에 사용된다. Scipy에서의 기능은 선형 디지털 필터를 앞으로 한 번, 뒤로 한 번 총 두 번 적용한다. 결합된 필터는 위상이 0이고 필터 차수가 원본의 두 배이다. 이 기능는 2차 섹션에서 숫자 문제가 적기 때문에 대부분의 필터링 작업에서 sosflitflit (output='filter'를 사용한 필터 설계) 필터링 기능이 flitf.. 2023. 7. 10.
[Machine Learning] Histogram-Based Gradient Boosting Ensembles Gradient Boosting Ensembles 부스팅은 트리 모델을 순차적으로 앙상블에 추가하는 앙상블 학습 알고리즘의 클래스를 말한다. 앙상블에 추가된 각 트리 모델은 앙상블에 이미 존재하는 트리 모델에 의해 발생한 예측 오류를 수정하려고 시도한다. 그레이디언트 부스팅은 AdaBoost와 같은 부스팅 알고리즘을 통계 프레임워크로 일반화하는 것으로, 훈련 과정을 가법 모델로 처리하고 임의 손실 함수를 사용할 수 있게 하여 기술의 능력을 크게 향상시킨다. 이와 같이 그레이디언트 부스팅 앙상블은 대부분의 구조화된 (ex: 표 형식 데이터) 예측 모델링 작업에 사용되는 기술이다. 그레이디언트 부스팅이 실제로 매우 잘 수행되지만 모델의 교육 속도가 느릴 수 있다. 이는 여러 CPU 코어를 활용하여 앙상블 멤.. 2023. 7. 7.
[Django] 북마크 앱 만들기 (1) 프로젝트 생성 django-admin startproject mysite . settings.py ALLOWED_HOSTS = [ 'localhost', '127.0.0.1', ] TEMPLATES = [ { "BACKEND": "django.template.backends.django.DjangoTemplates", "DIRS": [ os.path.join(BASE_DIR, 'templates'), ], "APP_DIRS": True, "OPTIONS": { "context_processors": [ "django.template.context_processors.debug", "django.template.context_processors.request", "django.contrib.auth.con.. 2023. 6. 28.
[Django] Books 어플리케이션 (2) URLconf books 앱 폴더에 urls.py 파일을 만들고 각 페이지에 맞는 URL을 매치한다. from django.urls import path from . import views app_name = 'books' urlpatterns = [ path('', views.BooksModelView.as_view(), name='index'), path('book/', views.BookList.as_view(), name='book_list'), path('author/', views.AuthorList.as_view(), name='author_list'), path('publisher/', views.PublisherList.as_view(), name='publisher_list'), ] 클.. 2023. 6. 27.
728x90
반응형
LIST