관련 작업 및 비교 접근법
접근 방식과의 비교를 위해 사용한 세 가지 최첨단 접근 방식을 소개한다. 바로 수작업 기능에 대해 훈련된 그레이디언트 부스팅 분류기 접근 방식에 따라 원시 일변량 시계열에 대해 훈련된 두 개의 컨볼루션 네트워크이다.
Features Based Approach
Gradient Boosting 모델은 설명된 대로 각 입력 센서에 대해 계산된 시간 영역 기능 및 주파수 영역 기능 등 수작업 기능에서 학습되었다. 보다 정확하게는 각 채널에서 α (0.5~4.5Hz), β (4.5~8.5Hz), β (8.5~11.5Hz), β (11.5~15.5Hz), β (15.5~30Hz)의 5개 대역으로 전력과 상대 전력을 추출하여 두 가지 기능을 모두 제공하였다. 또한 평균, 분산, 왜도, 첨도, 75% 양자 등과 같은 통계뿐만 아니라 이러한 대역 (5×4/2=10 보조 특징의 양)과 스펙트럼 엔트로피 특징 사이의 전력 비율을 추출했다. 이것은 결국 채널당 26가지 기능을 제공한다.
사용된 구현은 내부적으로 의사 결정 트리를 사용하는 XGBoost 패키지에서 가져온 것이다. 이 모델은 높은 예측 성능, 특이치에 대한 견고성, 불균형 클래스에 대한 견고성 및 최상의 분할에 대한 병렬 검색으로 알려져 있다. 교육은 범주형 교차 엔트로피도 최소화하여 수행되었다. 훈련 세트는 언더 샘플링 (under sampling)을 사용하여 균형을 맞췄다. 모델의 최대 트리 수는 1000개로 설정되었다. 개선이 관찰되지 않았을 때 훈련을 중지하기 위해 10과 동일한 인내를 가진 검증 범주 교차 엔트로피에 대한 조기 중지 콜백을 사용했다. 훈련은 모형에서 1000그루 이상의 나무를 만들지 않았다.
이 모델에는 분류 성능을 향상시키고 불균형 클래스에 대처하기 위해 조정해야 하는 몇 가지 하이퍼 매개 변수가 있다. 각 실험에 대한 최상의 하이퍼 매개 변수를 찾기 위해 하이퍼옵트 파이썬 패키지를 사용하여 무작위 검색을 수행했다. 구체적으로, 당면한 교육 및 검증 과목의 데이터만 고려한다. 각 초 매개 변수 세트에 대해, 우리는 5개의 서로 다른 훈련 및 평가 주제의 분할된 데이터에 대한 분류기를 훈련하고 평가하였다 (평가를 위한 훈련의 경우 80%). 검색은 50개의 초 매개 변수 세트로 수행되었으며 5개의 분할에서 평균화된 최상의 균형 잡힌 정확도를 달성한 세트가 선택되었다. (간격별 학습 속도 [10-4,10-1], 집합 {1,2,……,10}의 자목 최소 체중, {1,2,…,10}의 나무 최대 깊이, [0,1]의 정규화 매개 변수, [0.5,1]의 하위 샘플링 매개 변수, [0.5,1]의 열별 표본 추출 수준)
Convolutional Networks on Raw Univariate Time Series
2가지 종단간 딥러닝 접근 방식을 다시 구현하고 벤치마킹한다.
1) Tsinalis (2016)
치날리스의 접근법은 일변량 시계열 (단일 EEG 신호)을 처리하는 심층 컨볼루션 네트워크이다. 그것은 서류상 세부사항에 따라 다시 구현되었다. 이 접근법은 원래 네트워크에 150초의 신호, 즉 분류할 샘플과 이전 샘플 2개와 후속 샘플 2개를 더함으로써 시간적 맥락을 고려한다. 실험에서 시간적 맥락 없이 사용될 경우, 네트워크는 30초 샘플로 공급된다.
train은 범주적 교차 엔트로피를 최소화하여 수행되었으며, Adam 옵티마이저와 유사한 균형 잡힌 샘플링 전략이 사용되었다. 0.01로 설정된 추가 α2 정규화가 컨볼루션 필터에 적용되었다. 코드는 Keras로 텐서플로우 백엔드 로 작성되었다.
2) Supratak (2017)
Supratak 접근 방식은 신호의 주파수 내용을 처리하는 기능 추출기와 연속적인 30초 샘플의 신호를 처리하는 반복 신경망이라는 두 개의 블록을 포함하는 종단 간 심층 컨볼루션 네트워크이다. 특징 추출기는 특징 표현을 병합하기 전에 저주파 정보와 고주파 정보를 두 개의 뚜렷한 컨볼루션 하위 신경 네트워크로 처리한다. 그런 다음 결과 텐서는 소프트맥스 분류기로 공급된다. 이 블록은 균형 잡힌 샘플링으로 훈련된다. 그런 다음 특징 추출기는 2개의 bi-LSTM 레이어로 구성된 반복 신경망에 연결된다. 전체 아키텍처는 동일한 레코드에서 연속된 25개의 30초 샘플 시퀀스로 공급된다.
훈련은 범주적 교차 엔트로피를 최소화함으로써 수행되었고, Adam 옵티마이저와 함께 균형 잡힌 샘플링 전략이 사용되었다. 코드는 Keras로 텐서플로우 백엔드로 작성되었다.
https://ieeexplore.ieee.org/abstract/document/8307462
'Somnology > PSG (Polysomnography)' 카테고리의 다른 글
보행성 심폐 검진 (0) | 2022.05.06 |
---|---|
수면다원검사 (Polysomnography) (0) | 2022.04.13 |
Data and Preprocessing Steps (0) | 2022.04.12 |
Material and Methods (2) (0) | 2022.04.12 |
Material and Methods (1) (0) | 2022.04.12 |