본문 바로가기
Somnology/Lecacy, Heuristics & AI Model

[Deep Learning] RobustSleepNet

by goatlab 2022. 6. 22.
728x90
반응형
SMALL

RobustSleepNet

 

수면 장애 진단은 수면다원검사 (PSG) 기록의 분석에 의존한다. 이 검사의 예비 단계로 수면 단계가 체계적으로 결정된다. 실제로, 수면 단계 분류는 수면다원조영술 신호의 30초 epoch의 육안 검사에 의존한다. 이 지루하고 값비싼 작업을 대체하기 위해 수많은 자동 접근 방식이 개발되었다. 이러한 방법이 특정 데이터 세트에서 인간 수면 전문가보다 더 나은 성능을 보여주긴 했지만, 수면 클리닉에서는 거의 사용되지 않았다. 주된 이유는 각 수면 클리닉이 대부분의 자동 접근 방식이 즉시 처리할 수 없는 특정 PSG 몽타주를 사용하기 때문이다. 더욱이 PSG 몽타주가 호환되는 경우에도 자동 접근 방식은 인구 통계가 다른 보이지 않는 데이터에 대해 제대로 수행되지 않는다. 

 

이러한 문제를 해결하기 위해, 임의의 PSG 몽타주를 처리할 수 있는 자동 수면 단계 분류를 위한 딥러닝 모델인 RobustSleepNet을 소개한다. 이 모델을 인구 통계학적 변화에 강건하게 만들기 위해 8개의 heterogeneous 수면 단계 데이터 세트로 구성된 대규모 corpus에서 데이터 세트 제외 방식으로 이 모델을 훈련하고 평가했다. 보이지 않는 데이터 세트에 대해 평가할 때 RobustSleepNet은 이 데이터 세트에 대해 명시적으로 훈련된 모델의 F1의 97%에 도달한다. 따라서, RobustSleepNet은 모든 임상 설정에서 즉시 사용할 수 있는 고품질 자동 수면 단계를 수행할 수 있는 가능성을 열어준다. 또한, 보이지 않는 데이터 세트의 일부를 사용하여 RobustSleepNet을 미세 조정하면 이 데이터 세트에 대해 특별히 훈련된 모델과 비교할 때 F1이 2% 증가한다는 것을 보여준다. 

 

잠을 자는 동안 신체는 수면 단계라고 하는 다양한 생리적 상태를 교대로 전환한다. AASM (American Academy of Sleep Medicine) 가이드라인은 각성, NREM1, NREM2, NREM3 (또는 깊은 수면) 및 REM (급속 안구 운동)의 5가지 수면 단계를 정의한다. 수면 단계 분류는 기면증이나 수면 무호흡증과 같은 수면 장애의 진단에 체계적으로 사용되는 기본 도구이다. 수면다원검사 (PSG) 기록을 사용하여 수면 단계를 결정한다. 밤새 여러 생리학적 신호를 모니터링할 수 있지만 일반적으로 기록되는 신호는 뇌 활동 (EEG), 근육 활동(EMG), 안구 운동 (EOG), 심장 활동(ECG), 그리고 호흡이다. 임상 설정에서 수면 단계 분류는 일반적으로 기록된 신호를 시각적으로 분석하는 숙련된 수면 전문가가 수동으로 수행한다. 분석은 30초 epoch에서 수행되며, 각 epoch는 AASM에서 정의한 표준에 따라 5가지 수면 단계 중 하나와 연관된다. 수동 분류는 전체를 기록하는 데 최대 1시간이 걸리므로 (약 1000 epoch 또는 8시간 길이) 상당하다. 수면 채점 지침은 피험자 사이에 존재하는 패턴의 다양성을 완전히 반영하지 않는다. 결과적으로 다른 채점자는 동일한 에포크를 다르게 해석할 수 있다. 2,500명 이상의 채점자가 득점한 밤을 분석한 결과, 수면 단계 전반에 걸쳐 평가자 간 평균 동의율이 82.6%로 나타났다. 평가자 간 동의는 데이터 세트 인구 통계와 연구가 기록된 수면 센터에 크게 의존한다. 경험에 따르면 나이가 많은 피험자나 수면 장애가 있는 피험자 가 포함 된 데이터 세트는 건강한 피험자로 구성된 데이터 세트보다 평가자 간 동의가 더 낮다.

 

수동 수면 병기의 높은 비용과 상대적으로 중요한 편향으로 인해 자동 수면 병기 시스템 개발에 대한 관심이 높아졌다. 최근 딥러닝은 감독 학습 컨텍스트에서 자동 수면 단계에서 인간의 성능에 성공적으로 도달했다. 그럼에도 불구하고 대부분의 수면 클리닉에서는 자동화된 수면 단계 방법이 사용되지 않고 있다. 수면 클리닉이 여전히 수동 수면 단계에 의존하는 이유를 설명하기 위해 두 가지 중요한 요소를 확인했다. "입력 형태 비호환성" 및 "정확도 저하 문제"라는 용어를 사용하여 이를 참조할 것이다.

 

입력 형태 비호환성 문제는 실용적이다. 각 수면 클리닉에는 사용된 장치, 대상 인구의 특수성 또는 연구의 특정 요구 사항에 따라 다를 수 있는 특정 PSG 몽타주가 있다. 자동 접근 방식은 특정 입력 모양만 처리할 수 있다. 특정 몽타주가 있는 특정 데이터 세트에서 훈련된다. 다른 PSG 몽타주는 호환되지 않는 입력 모양을 생성할 수 있으므로 모델에 대한 출력을 계산할 수 없다.

 

반대로 PSG 몽타주가 두 데이터 세트 간에 호환될 때 정확도 저하 문제가 발생한다. 이 경우 첫 번째 데이터 세트에서 훈련된 모델은 두 번째 데이터 세트에서 출력을 계산할 수 있지만 성능이 떨어질 수 있다. 이러한 성능 저하는 두 데이터 세트 간의 인구 통계학적 분포의 차이로 인한 것으로 생각된다. 그러나 또 다른 원인은 채널 불일치일 수 있다. 실제로 기록된 신호는 다를 수 있다 (ex: 다른 EEG 위치, 다른 센서 기술). cohen's kappa (κ) 수면 무호흡증이 있는 대상에 대해 평가할 때 건강한 대상에 대해 훈련된 모델의 84.6%에서 45.7%로 떨어진다. 모델이 무호흡 환자에 대해 훈련되고 건강한 대상에 대해 평가되었을 때 감소는 82.3에서 77.6에 불과했다. 유사하게, 젊고 건강한 피험자의 데이터 세트에서 평가할 때 나이든 피험자가 포함된 데이터 세트에서 훈련된 모델의 균형 잡힌 정확도는 10포인트 떨어진다. MASS 데이터세트의 EEG 및 EOG 파생에 대해 훈련되고 Sleep-EDF 데이터세트에서 평가된 모델 에서지도 학습 상대와 비교하여 11포인트의 매크로-F1 하락을 경험한다. 이 하락은 두 데이터세트에서 EEG 파생물이 다르기 때문일 수 있다. 모델이 EEG에서 훈련되고 EOG 채널에서 평가될 때 하락은 20포인트 이상으로 증가한다. 여태까지 입력 형태 비호환성은 다루어진 적이 없다. 그러나 정확도 저하 문제를 해결하기 위해 몇 가지 접근 방식이 사용되었다. 모델은 MASS (Montreal archive of sleep Studies) 데이터 세트에서 사전 훈련되었고 Sleep-EDF 데이터 세트에서 미세 조정되었다. 미세 조정은 지도 학습 설정에서 도달한 성능을 3~5점까지 높인다. 유사하게, 모델은 MASS에 대해 사전 훈련되었고, 첫 번째 밤에는 Sleep-EDF의 주제에서 미세 조정되었으며 두 번째 밤에는 평가된다. finetuning은 성능을 6포인트 증가시켰고, finetuned 모델은 지도 학습 모델보다 단 1포인트 낮았다. 과적합을 피하기 위해 강력한 정규화를 사용했다. 소스 데이터 세트와 대상 데이터 세트의 관측치를 정렬하여 둘 사이의 분포 이동을 줄였다. 이 방법은 대상 데이터 세트의 레이블이 필요하지 않지만 균형 잡힌 정확도는 감독된 기준선보다 10포인트 낮다. 그러나 이러한 모든 방법은 학습을 위해 대상 데이터 세트의 일부를 사용하므로 특정 대상 데이터 세트에 대해 모델을 다시 학습하고 조정하는 데 드는 높은 고정 비용이 제거되지 않습니다. 따라서 대부분의 수면 클리닉에서 사용할 수 없다.

 

이 연구에서 수면 클리닉에서 보이지 않는 데이터에 즉시 사용할 수 있는 접근 방식을 설계하는 것을 목표로 했다. 먼저 모든 PSG 몽타주, 즉 모든 입력 형태를 처리할 수 있는 딥러닝 모델인 RobustSleepNet을 도입하여 입력 형태 비호환성을 해결한다. 이 입력 불변 속성을 통해 두 번째 문제인 보이지 않는 데이터의 정확도 저하를 해결할 수 있다. 모델의 일반화 능력을 증가시키기 위해 상당한 입력 센서와 인구 통계학적 가변성을 가진 8개의 데이터 세트로 구성된 대규모 corpus에서 모델을 훈련함으로써 이 문제를 해결한다.

 

방법

 

5개의 데이터 세트와 데이터 세트당 5개의 주제로 작업하는 동안 세 가지 학습 설정의 그림

1. Direct Transfer (DT)

2. Learning from scratch (LFS)

3. Finetuning (FT)

시간 컨텍스트가 3일 때 RobustSleepNet의 아키텍처
8개의 데이터 세트에 대한 3가지 고려된 학습 설정 (LFS, FT, DT)에 대한 RobustSleepNet 벤치마크

 

https://ieeexplore.ieee.org/abstract/document/9492125

 

RobustSleepNet: Transfer Learning for Automated Sleep Staging at Scale

Sleep disorder diagnosis relies on the analysis of polysomnography (PSG) records. As a preliminary step of this examination, sleep stages are systematically determined. In practice, sleep stage classification relies on the visual inspection of 30-second ep

ieeexplore.ieee.org

 

728x90
반응형
LIST