본문 바로가기
Biomedical & AI/Characterization

특성 엔지니어링

by goatlab 2022. 4. 27.
728x90
반응형
SMALL

특성 엔지니어링 (Feature engineering)

 

생체의학 신호의 특성화는 잡음, 신호의 확률적 특성, 개인 내 및 개인 간의 큰 변동성으로 인해 어렵다. 따라서, 통계적 특징 생성, 변환 기반 특징 생성 및 추출, 시간-주파수 분석이 필요하다. 기능 선택은 중복되고 정보가 없는 기능을 제거하는 것을 목표로 하므로 광범위한 테스트 모집단에서 일반화하는 모델을 구축할 수 있다.

 

전형적인 패턴 인식 시스템

 

파이프라인은 "실제 세계"에서 데이터를 캡처하고 이러한 데이터를 원시 데이터 개체로 표시하는 센서로 구성된다. 아티팩트 및 원치 않는 노이즈 제거, 대체 양식을 얻기 위한 데이터 변환, 평균 강도 / 진폭 수준 조정, 다운샘플링 (decimation) 또는 업샘플링 (보간, interpolation)과 같은 다음 단계를 위해 데이터를 준비하기 위한 전처리 메커니즘이 필요하다. 기능 생성 및 엔지니어링은 신호에서 중요한 기능을 추출하기 위해 전문 영역 지식이 필요하다 (ex: 특정 관심 영역을 분할하고 기능 설명자 계산).

 

생성된 기능은 데이터에서 모델링하려는 잠재 구조와 강력한 상관 관계가 있을 것으로 예상한다. 그러나 생성된 기능의 수는 매우 많을 수 있다. 따라서 기능 선택 단계가 필요하다. 기능 선택은 원래 기능의 하위 집합, 최상의 기능의 가중치 조합 또는 투영 또는 비선형 임베딩으로 얻은 추출된 기능으로 구성된 새로운 기능 공간을 생성하는 것을 목표로 한다. 마지막으로, 추출된 특징을 우리가 예측하려는 임상 정보와 연관시키는 매핑을 학습하기 위해 새로운 특징 공간에 대한 예측 모델을 훈련한다 (ex: 당 수치, 백혈구 수, 단백질, 지질 또는 대사 산물과 같은 특징).

 

생체의학 신호의 특성화는 잡음, 신호의 확률적 특성, 개인 내 및 개인 간의 큰 변동성으로 인해 어렵다. 특징은 신호에 존재 하는 패턴에서 얻은 측정 가능한 양이다. 센서에서 얻은 원시 기능은 기능 엔지니어링 단계에 제공된다. 기능 공학은 다양한 패턴을 감지하는 데 사용할 수 있는 필수 기능을 추출한다. 좋은 기능 표현을 통해 데이터의 두드러진 구조를 학습하는 강력한 모델을 구축할 수 있다. 예를 들어, 데이터의 새로운 표현을 얻기 위해 슬라이딩 필터링 작업, 푸리에 변환을 적용하고 데이터의 로컬 영역에서 기술적인 통계 측정값을 추출할 수 있다.

 

d 측정값 x1, …, xd의 유한 집합을 사용하여 d차원 특징 공간 x로 신호 f(t)를 표현할 수 있다. 여기서 d는 특징의 총 수이다. 이제 원시 신호를 버리고 새로운 특징 벡터 x로 대체할 수 있다.

 

728x90
반응형
LIST

'Biomedical & AI > Characterization' 카테고리의 다른 글

통계적 특징  (0) 2022.04.27
시간-주파수 분석  (0) 2022.04.27
이산 푸리에 변환  (0) 2022.04.27