728x90 반응형 SMALL resampling2 [Data Science] 데이터 불균형 데이터 불균형 편향된 클래스 비율이 포함된 분류 데이터 세트를 불균형이라고 한다. 데이터 세트의 상당 부분을 차지하는 클래스를 메이저 클래스라고 한다. 더 작은 비율을 구성하는 항목은 다수 클래스이다. 불균형도 소수 집단 비율 약간 전체 데이터셋의 20~40% 보통 전체 데이터셋의 1~20% 높음 전체 데이터셋의 1%미만 대부분의 머신러닝 모델은 클래스 간의 데이터 비율이 비슷한 것이 바람직하다. 데이터 불균형이 크면 메이저 클래스로 치우치게 predict하는 문제가 발생한다. 데이터 불균형을 해결하는 방법으로는 크게 다음과 같다. 리샘플링 (Resampling) Weighting in Loss Function 리샘플링 (Resampling) 리샘플링 기법은 클래스별 불균형한 데이터의 수를 맞춰주기 위해.. 2023. 9. 6. [EEGLAB] 데이터 전처리 (Resampling) (3) 샘플 EEGLAB 데이터세트 로드 메뉴 항목 File을 선택하고 하위 메뉴 항목 Load existing dataset를 누른다. 도구 상자와 함께 배포되고 EEGLAB의 "sample_data" 폴더에 있는 "eeglab_data.set" 튜토리얼 파일을 선택한다. 그런 다음 Open를 누른다. 샘플링 속도 변경 Tools → Change sampling rate의 가장 일반적인 용도 는 샘플링 속도를 줄여 메모리와 디스크 스토리지를 절약하는 것이다. 새 샘플링 속도를 묻는 pop_resample.m 창이 나타난다. 함수는 MATLAB resample.m을 사용한다 (신호 처리 도구 상자에서 – 이 도구 상자가 없으면 느린 MATLAB 함수 griddata 사용). 이미 허용 가능한 샘플링 속도에 있으.. 2022. 4. 15. 이전 1 다음 728x90 반응형 LIST