본문 바로가기
Biomedical & AI/ML ECG applications

ECG 심장박동 분류기

by goatlab 2022. 4. 29.
728x90
반응형
SMALL

ECG 심장 박동 분류기 (ECG heartbeat classifier)

 

ECG 분석은 심혈관 병리 진단에 중요한 자원이다. ECG 파형의 심장 리듬 장애는 근본적인 심혈관 문제의 증거이다. ECG 신호의 수동 분석은 어렵고 시간이 많이 소요되며 신호에서 다양한 파형 형태를 감지하고 분류하도록 잘 훈련된 전문가가 필요하다.

 

서포트 벡터 머신 (SVM), 베이지안 분류, 신경망, LDA, k-최근접 이웃 (kNN) 및 결정 트리와 같은 여러 기계 학습 알고리즘을 심장박동 분류에 사용할 수 있다. 여기서, SVM은 서로 다른 클래스 간의 마진을 최대화하는 결정 경계를 찾는다. SVM은 적은 수의 지원 벡터 (즉, 결정 경계에 가장 가까운 훈련 샘플)로 표현된 희소 솔루션을 제공하기 때문에 우수한 일반화 속성을 가지고 있다.

 

ECG 신호 설명 (ECG signal descriptor)

 

전형적인 심장 박동은 P파, QRS 콤플렉스 및 T파와 같은 독특한 수의 구조로 구성된다. 각 구조에는 고유한 형태, 진폭, 지속 시간 및 주파수 내용이 있다. ECG 신호 설명자는 신호의 다양한 측면을 캡처하기 위해 여러 기능을 결합한다. 이것은 신호의 적절한 표현을 제공하고 더 정확하고 신뢰할 수 있는 분류기를 훈련할 수 있도록 한다. 기능 descriptor는 ECG 신호를 특성화하기 위해 여러 기능을 결합하여 구축된다. 그런 다음 descriptor는 심장 부정맥 감지를 위한 분류기를 훈련하는 데 사용된다.

 

ECG 신호는 심장의 전기적 활동의 시간 변화를 반영하는 시계열 신호이다. 고주파 및 저주파 왜곡으로 인해 ECG 신호의 품질이 저하될 수 있다. 예를 들어, dc 오프셋, 전력선의 저주파 간섭, 근육 수축으로 인한 고주파 간섭, 호흡 운동으로 인한 기준선 이동, 전극 접촉 불량으로 인한 노이즈가 있다.

 

소음은 부정맥의 잘못된 진단을 초래할 수 있다. 따라서 신호 전처리의 주요 목표는 ECG 기록에서 노이즈를 제거하고 인공물을 제거하는 것이다. dc 오프셋을 제거하기 위해 평균에서 ECG 레코드를 빼서 레벨 0에서 글로벌 신호 기준선을 만든다. 전력선 간섭은 50Hz (또는 국가에 따라 60Hz)와 그 고조파를 중심으로 하는 대역 차단 필터를 사용하여 억제할 수 있다. 환자의 근육 수축으로 인한 소음은 저역 통과 k-포인트 이동 평균 필터 (ex: k=11)를 사용하여 줄일 수 있다.

 

QRS 컴플렉스는 ECG 신호에서 심장 주기를 분할하는 독특한 기능이다. QRS 감지 알고리즘의 정확도는 QRS 복합 형태 및 지속 시간의 자연적 변동성 및 모션 아티팩트 및 기준선 방황과 같은 노이즈 소스와 같은 다양한 요인의 영향을 받는다. QRS 분할 방법은 주로 신호 ​​전처리 및 임계값 기반 QRS 검출기의 두 단계로 구성된다. Pan과 Tompkins는 비트 분할에 널리 사용되는 알고리즘 중 하나를 제안했다. 배경 소음이 먼저 제거된다. 그런 다음 ECG 신호는 QRS 컴플렉스를 증폭하기 위해 제곱된다. 마지막으로, 필터링된 신호의 피크를 감지하기 위해 몇 가지 적응형 임계값이 적용된다.

 

ECG 신호는 원치 않는 노이즈를 제거하고 ECG 기준선을 제거하기 위해 전처리 단계를 통과한다. 그림과 같이 기준선 이동은 가슴의 움직임으로 인한 아티팩트이다. 이것은 손상된 ECG 신호에서 저주파 성분으로 나타나며 저주파 억제를 사용하여 저주파를 감쇠함으로써 제거할 수 있다. 기준선 방황을 제거하는 한 가지 일반적인 방법은 2개의 다른 창 크기를 사용하여 2개의 이동 중앙값 필터를 계단식으로 연결하는 것이다 (ex : window 크기 57을 사용하여 이동 중앙값 필터를 적용한 후 크기 151의 다른 이동 중앙값 필터 적용). 주석이 달린 MIT-BIH 레코드에서 제공된 R파의 위치는 ECG 신호에서 QRS 위치를 얻는 데 사용된다. 그런 다음 고정 크기 w의 window를 사용하여 R 파동 위치 주변의 샘플을 추출하여 ECG 비트를 분할한다.

 

신호 전처리를 사용한 기준선 변동 제거. 전처리된 신호는 윈도우 길이가 각각 57 및 151 샘플인 2단계 중앙값 필터를 적용하여 생성

 

환자 내 및 환자 간 패러다임 (Intra- and interpatient paradigms)

 

훈련 및 테스트 데이터 세트 생성은 일반화를 개선하고 과적합을 최소화하는 데 사용되는 데이터 과학의 중요한 개념이다. 테스트 데이터를 생성하는 한 가지 방법은 데이터를 훈련 데이터와 테스트 데이터의 두 하위 집합으로 나누는 것이다. 그런 다음 모델은 훈련 데이터를 사용하여 적합하고 보이지 않는 테스트 데이터에서 테스트된다.

 

데이터를 분할하는 데 사용할 수 있는 몇 가지 방법이 있다. ECG 심장 박동 분류의 맥락에서 두 가지 데이터 분할 패러다임이 일반적으로 사용된다.

 

환자 내 패러다임은 비트 유형을 기반으로 데이터 세트에서 훈련 및 테스트 하위 집합을 생성한다. 이 방식의 주요 제한 사항 중 하나는 실제 분류기 성능을 지나치게 낙관적으로 추정한다는 것이다. 이는 동일한 환자의 심장 박동이 훈련 데이터 세트와 테스트 데이터 세트 모두에 나타날 수 있기 때문이다. 보다 강력한 분할은 환자 간 패러다임을 사용한다. 여기에서 분류기를 훈련하는 데 사용된 환자는 분류기를 평가하는 데 사용된 환자와 다르다. 이렇게 하면 동일한 환자의 비트가 훈련 및 테스트 세트에 존재하지 않는다. 또한 개인 간 변동을 고려하므로 분류 성능에 대한 편향되지 않은 추정치를 제공한다.

 

심장박동 분류기의 성능은 환자간 테스트 패러다임을 사용하여 평가될 것이다. 다음 데이터 세트는 MIT-BIH 데이터베이스에서 생성된다. DS1=[101, 106, 108, 109, 112, 114, 115, 116, 118, 119, 122, 124, 201, 203, , 205, 29080 , 215, 220, 223, 230] 및 DS2=[100, 103, 105, 111, 113, 117, 121, 123, 200, 202, 210, 212, 2, 210, 212, 2, 213, 2914, 2 , 232, 233, 234]. 기록 [102, 104, 107, 217]은 페이싱된 기록이며 훈련 및 테스트 데이터 세트에서 제외된다. 또한 모델 교육 및 테스트를 위해 MLII 리드만 추출된다. 마지막으로 클래스 레이블은 AAMI 비트 분류 기준에 따라 추출된다 (단, class-5, 즉 Q-class 또는 "unclassified category"는 사용하지 않음).

 

기능 생성

 

정확한 심장 박동 분류는 심장 부정맥을 감지하는 첫 번째 단계로 간주된다. 심장박동 분류 절차는 전처리, 박동 세분화, 특성 엔지니어링, 특성 처리, 분류 및 평가의 단계로 구성된다. 심장박동 분류는 일반적으로 심장박동 세그먼트에서 기능을 추출하는 데 의존한다. 추출된 ECG 박동의 여러 속성은 분류 모델의 기능으로 사용할 수 있다. 이러한 특징은 사용된 방법에 따라 범주로 그룹화할 수 있다 (ex: 통계적, 시간적, 빈도, 웨이블릿 및 형태적 특징). 특징 선택 및 차원 축소는 일반적으로 특정 기계 학습 모델을 훈련하기 전에 수행된다. 이것은 계산 비용을 줄이고 일반화를 향상시킨다.

 

통계 기능은 시간 도메인의 ECG 신호 진폭 변화에서 요약 통계를 추출하는 데 유용하다. 표준 기능에는 평균이 포함된다. (median, maximum, minimum, 분산, 첨도 및 왜도와 같은 고차 통계적 모멘트)

 

시간 기능에는 ECG 파형의 간격 기반 측정이 포함된다 (ex: 이전 및 다음 RR 간격 (RRI) 계산 이전/다음 10 RR 간격의 평균, 최소 및 최대 지속 시간; QRS 콤플렉스의 너비).

 

형태적 특징 추출은 신호 프로파일의 정보를 사용하여 local 기하학을 모델링한다. 예를 들어, local binary patterns (LBP)은 형태학적 특징을 추출하는 데 사용되었다. 예를 들어, 각 세그먼트에 대해 중앙 샘플을 이웃 샘플과 비교하는 8개 샘플 이웃 연산자를 적용한다. 샘플이 중앙 샘플보다 큰지 여부를 나타내기 위해 1과 0의 이진 스트림이 생성되고, 그렇지 않으면 0이 출력된다. 이진수는 십진수로 변환되고 히스토그램은 k-bin을 사용하여 계산된다. 그런 다음 기능은 해당 박동에 대한 k - bin LBP 히스토그램 또는 모드, 평균, 중앙값, 왜도 및 첨도와 같은 생성된 히스토그램의 일부 요약 통계이다.

 

728x90
반응형
LIST