728x90 반응형 SMALL 분류 전체보기1632 [Audio Processing] librosa specshow librosa specshow import librosa as liimport librosa.displayimport numpy as npimport matplotlib.pyplot as pltimport scipy.signal as sig# load sample audiofile = li.ex('trumpet')aud, sr = li.load(file, sr=None)n_ftt = 512rsr = 11025# apply low pass filter before downsampling. Attenuate at resample rate divided by 2.cutoff = rsr / 2sos = sig.butter(10, cutoff, fs=sr, btype='lowpass', analog=False, .. 2023. 7. 5. [Scikit-Learn] HistGradientBoostingClassifier sklearn.ensemble.HistGradientBoostingClassifier 이 추정기는 큰 데이터 세트(n_samples >= 10,000)에서 GradientBoostingClassifier보다 훨씬 빠르다. 이 추정기는 누락된 값 (NaN)을 기본적으로 지원한다. 훈련하는 동안 나무 재배자는 누락된 값이 있는 샘플이 잠재적 이득에 따라 왼쪽 또는 오른쪽 자식으로 이동해야 하는지 여부를 각 분할 지점에서 학습한다. 예측할 때 누락된 값이 있는 샘플은 결과적으로 왼쪽 또는 오른쪽 자식에 할당된다. 교육 중에 지정된 기능에 대해 누락된 값이 없으면 누락된 값이 있는 샘플은 가장 많은 샘플이 있는 하위 항목에 매핑된다. 결측치 처리 import numpy as np import pandas as .. 2023. 7. 5. [SciPy] 버터워스 필터 (Butterworth Filter) 버터워스 필터 (Butterworth Filter) 버터워스 필터는 주파수 응답 특성이 매우 부드러운 필터로, 위상 왜곡을 최소화하는 필터이다. 버터워스 필터는 주파수 영역에서 특정 주파수 범위를 통과시키고, 그 외의 주파수 범위는 차단하는 필터이다. 버터워스 필터는 주파수 응답 특성을 설정할 수 있는 매개 변수인 Q값을 가지고 있다. Q값이 높을수록 주파수 응답 특성이 더 부드러워지고, 위상 왜곡이 줄어든다. 버터워스 필터로 위상 왜곡을 없애려면 Q값을 매우 높게 설정해야 한다. Q값을 너무 높게 설정하면 필터의 통과 대역폭이 매우 좁아져서 필터링된 신호의 품질이 저하될 수 있다. 따라서, Q값을 적절하게 설정하여 위상 왜곡을 최소화하고 필터링된 신호의 품질을 유지해야 한다. Q값은 품질 계수를 의미한.. 2023. 7. 5. Heart Rate Variability : Standards of Measurement, Physiological Interpretation, and Clinical Use Heart Rate Variability : Standards of Measurement, Physiological Interpretation, and Clinical Use 심박수 특성은 사람이 상대적으로 정지해 있을 때 ECG 또는 PPG 센서가 각 펄스의 시간을 감지할 수 있으므로 반동 간격 (Interbeat Interval, RR 값)을 안정적으로 얻을 수 있다는 사실을 활용한다. 일련의 RR 간격 (또는 NN 간격)을 가짐으로써 다음과 같은 관심 에포크에 대한 표준 심박 변이도 (HRV) 메트릭을 계산할 수 있다. HF 전력 (0.15~0.4Hz) LF 전력 (0.04~0.15Hz) VLF 전력 (0.015~0.04Hz) RMSSD pNN50 델타 RR 평균 심박수 90번째 백분위수 심박수 1.. 2023. 7. 5. [LightGBM] 매개변수 조정 (Parameters Tuning) (3) For Better Accuracy 큰 max_bin 사용 (더 느릴 수 있음) num_iterations가 많은 작은 learning_rate 사용 큰 num_leaves 사용 (과적합의 원인이 될 수 있음) 더 큰 교육 데이터 사용 dart를 시도 Deal with Over-fitting 작은 max_bin 사용 작은 num_leaves 사용 min_data_in_leaf 및 min_sum_hessian_in_leaf 사용 bagging_fract 및 bagging_freq를 설정하여 bagging 사용 feature_fraction을 설정하여 피쳐 하위 샘플링 사용 더 큰 학습 데이터 사용 정규화를 위해 lambda_l1, lambda_l2 및 min_gain_to_split을 사용 깊은 트리가 자.. 2023. 7. 3. 유의 확률 (P-Value) 유의 확률 (P-Value) 통계적 가설 검정에서 유의 확률 (有意 確率, significance probability, asymptotic significance) 또는 p-값 (p-value, probability value)은 귀무 가설이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률이다. 실험의 유의 확률은 실험의 표본 공간에서 정의되는 확률 변수로서, 0~1 사이의 값을 가진다. p-값 (p-value)은 귀무 가설 (null hypothesis)이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 같거나 더 극단적인 통계치가 관측될 확률이다. 여기서 말하는 확률은 빈도주의 (frequentist) 확률이다. p-값 (p-value)는 관찰된 데이터가 귀무가설과 양립하는 .. 2023. 7. 3. Cohen's Kappa Cohen's Kappa 일반적으로 카파 상관 계수는 코헨 (Cohen)의 카파 상관 계수 (Kappa)를 가리키며 이는 2명의 관찰자 (또는 평가자)의 신뢰도를 확보하기위한 확률로서 평가 지표로 사용되는 상관 계수이다. 2명 이상에서 신뢰도를 얻기 위해서는 플레이스 카파 상관 계수 (Fleiss' kappa)를 사용할 수 있다. 이 메트릭은 두 평가자 (ex: 지상 실측값, 인간 레이블링 및 추정자) 간의 일치를 측정하는 것이 목표이다. 평가자가 완전한 인식 없이 (일반적으로 우연히) 일치할 가능성을 고려한다. 계산은 다음과 같다. 두 값은 평가자 간에 관측된 합치도와 확률 합치도를 각각 나타낸다. 계수 κ은 0 (합치 없음)과 1 (합치 합계) 사이에 제한된다. 실제로, pobserved = 1과 p.. 2023. 7. 3. Sleep stages classification based on heart rate variability and random forest (5) 결과 정규화 전후의 전형적인 HRV 특징의 히스토그램을 비교하였다. 왼쪽 그림은 정규화 전의 히스토그램을 나타내고 오른쪽 그림은 정규화 후의 히스토그램을 나타냅니다. 제안하는 방법은 이상치에 관계없이 대부분의 특징을 [0,1] 범위에 매핑할 수 있음은 자명하다. 이 우세한 전처리는 주체 독립 체계 내에서 수면 단계 분류에 효과적인 기능을 제공했다. 표는 피처 정규화를 사용하거나 사용하지 않는 주제별 체계 및 주제 독립적 체계에 대한 모든 개인의 혼동 행렬을 제공한다. 표의 숫자는 해당 에포크의 양을 나타낸다. 본 논문에서 제시하지 않은 개별 혼동 행렬에 따라 두 가지 체계를 기반으로 각 단계와 다른 단계를 분류하기 위한 정확도와 Cohen의 kappa 통계량 κ를 나타내었다. 또한, 전체 정확도와 κ 통.. 2023. 6. 29. Sleep stages classification based on heart rate variability and random forest (4) Classifier model: Random Forest RF는 각 내부 노드에서 p 기능의 부트스트랩 샘플링 하위 집합에서 분할 기능을 선택하는 많은 수의 결정 트리로 구성된다. 트리는 가지치기 없이 CART (Classification And Regression Tree) 방법론을 통해 구축된다. 최종 예측은 앙상블 예측의 다수결로 결정된다. RF의 중요한 기능은 훈련 과정에서 각 기능의 중요성을 평가하는 것이다. 실제로 RF를 구성하는 동안 OOB (out-of-bag) 샘플이라고 하는 원래 훈련 세트의 약 33%가 일반적인 부트스트랩 샘플에서는 발생하지 않는다. 특정 기능의 중요성을 평가하기 위해 처음에는 OOB 샘플에 대한 해당 값을 임의로 치환한다. 그런 다음 수정된 OOB 샘플이 새로운 예측.. 2023. 6. 29. Sleep stages classification based on heart rate variability and random forest (3) Nonlinear features 시간 도메인 및 주파수 도메인 기능에 의해 무시되는 일부 정보를 제공하기 때문에 많은 고급 비선형 방법이 HRV 분석에 적용되었다. 그러나 안정적인 결과를 얻기 위해서는 장기간의 데이터 시리즈가 필요한 경우가 많다. 본 연구에서는 단기 HRV 분석에 적합한 일부 비선형 접근법만 사용하였다. 이러한 방법에는 detrended 변동 분석, 멀티스케일 엔트로피, 상호 정보, 자기 상관 계수 및 제로 크로싱 분석이 포함된다. Detrended fluctuation analysis (DFA) DFA는 다항식 노이즈를 제거하여 장거리 전력법 상관 관계를 감지하고 조사된 비선형 데이터의 본질적인 변동을 얻을 수 있다. 시계열 x(n) = {x(1), x(2), ⋯, x(N)}의 경우.. 2023. 6. 29. 이전 1 ··· 30 31 32 33 34 35 36 ··· 164 다음 728x90 반응형 LIST