본문 바로가기
728x90
반응형
SMALL

Statistics22

Fleiss's Kappa Fleiss's Kappa 모델에서 라벨링 후 데이터의 품질을 확인하기 위해 작업자 간에 라벨링을 얼마나 비슷한 기준으로 했는지를 평가하는 방법이 작업자간 일치도 (IAA)평가이다. IAA의 대표적인 방법으로는 Kappa 계수와 Krippendorff's α (KLUE)가 존재한다. Cohen's Kappa 계수는 두 개의 관찰자가 있는 경우에만 사용된다. 비교 중인 이진 변수에 대해 2개 이상의 관찰자가 있거나 2개 이상의 범주가 있는 경우 "Fleiss Kappa 계수"라고 하는 또 다른 일치 측도를 계산해야 한다. 계수는 관측치의 등급 단위에서 전반적인 일관성을 나타내는 측도이다. 전체 Kappa 공식은 Cohen's Kappa와 동일하지만 p0와 pe는 다르게 계산된다. 여기서 N은 대상의 총 개.. 2023. 8. 17.
statsmodels statsmodels statsmodels는 통계 모델에 대한 기술 통계 및 추정 및 추론을 포함하여 통계 계산을 위해 scipy를 보완하는 Python 패키지이다. python -m pip install statsmodels Main Features 선형 회귀 모델 일반 최소 제곱 일반화된 최소 제곱 가중 최소제곱 자기회귀 오류가 있는 최소제곱 분위수 회귀 재귀적 최소제곱 효과 및 분산 성분이 혼합된 혼합 선형 모델 GLM: 모든 단일 매개변수 지수군 분포를 지원하는 일반화 선형 모델 이항 및 푸아송을 위한 베이지안 혼합 GLM GEE: 단방향 클러스터 또는 종단 데이터에 대한 일반화된 추정 방정식 개별 모델 로짓과 프로빗 다항 로짓 (MNLogit) 포아송 및 일반화 포아송 회귀 음이항 회귀 제로 팽.. 2023. 7. 18.
임상 개발 용어 (2) 1차 유효성 평가 변수 (Primary endpoint) 임상 시험의 목적을 정확하게 나타내는 변수이다. 임상적 연관성이 가장 높고 임상 시험의 주요 목적과 직접적으로 연관되는 증거를 나타내야 하는 것이며 일반적으로 하나의 일차 변수가 존재한다. 대부분의 확증 시험의 주 목적은 유효성에 대한 과학적 증거를 제시하는 것이기 때문에 일차 변수는 대부분 유효성 평가 변수이다. 안전성이나 내약성은 때때로 일차 변수가 될 수도 있다. 또한, 삶의 질 및 의료 비용의 측정도 중요한 잠재적 일차 변수이다. 일차 변수를 선정할 때, 선행 연구에서 선택된 기준 및 표준에 근거하여 믿을만한 변수를 사용해야 한다. 일차 변수는 피험자 수를 추정하는데 이용한다. 2차 유효성 평가 변수 (Secondary endpoint) 1.. 2023. 7. 18.
임상 개발 용어 (1) 모집단 (Population) 임상 시험에 대한 통계적인 관찰의 대상이 되는 집단 전체이다. 모집단은 예측 집단과 비슷한 성격을 가져야 하며, 피험자의 특징이고르게 분포된 집단이어야 한다. 표본 (Sample) 모집단에서 선택된 구성 단위의 일부이다. 표본은 모집단을 적절히 대표할 수 있어야 한다. 귀무 가설 (H0) 귀무 가설 (H0) 대립 가설의 입증에 실패하여 채택할 수 밖에 없는 가설이다. 대립 가설 (H1) 시험자가 임상 시험을 통해 증명하려는 가설이다. 제 1종 오류 (Type Ⅰ error) 귀무 가설이 참임에도 불구하고, 잘못하여 귀무 가설을 기각하고 대립 가설을 채택할 확률이다. 제 2종 오류 (Type Ⅱ error) 대립 가설이 참임에도 불구하고, 잘못하여 대립 가설을 기각하고 귀무 .. 2023. 7. 18.
검정 방법 검정 방법 제1종 오류 α와 제2종 오류 β 모두 최소화할 수 있는 검정법을 찾으면 가장 이상적이겠으나 α가 작아지면 β는 증가한다. 그래서 통계적 가설 검정에서는 α를 고정시키고 그에 따른 기각역 (rejection region) 을 구한다. 이제 귀무 가설이 참이라고 가정한 상태에서 표본으로부터 검정 통계량을 구하게 되고 이 검정 통계량이 기각역에 있게 되면 귀무 가설을 기각하고 기각역 밖에 있으면 귀무 가설을 기각하지 못한다. 즉, 귀무 가설이 참일 때 귀무 가설을 기각할 확률이 α보다 작거나 같다. 일반적으로 α는 0.05를 사용하고 유의 수준 (level of significance)이라고 부른다. 검정력의 크기를 결정하는 요인 적정 크기의 검정력이 확보된 연구에서 의미있는 효과가 실제로 존재하.. 2023. 7. 17.
가설 검정 (Hypothesis Testing) 가설 검정 (Hypothesis Testing) 모집단에 대한 주장과 관련해, 표본의 정보를 사용해서 가설이 맞는지 아닌지 판정하는 과정이다. 가설 검정에서의 오류 실제 검정 결과 H0 참 H0 거짓 H0 기각 실패 옳은 결정 제 2종 오류 (β) H0 기각 제 1종 오류 (α) 옳은 결정(1-β) 제 1종의 오류는 귀무 가설이 참일 때 표본에 근거하여 검정한 결과 귀무 가설을 기각할 때 발생한다. 제1종의 오류를 저지를 확률을 α로 표기한다. 제 2종의 오류는 귀무 가설이 거짓일 때 표본에 근거하여 검정한 결과 귀무 가설을 기각하지 못할 때 발생한다. 제 2종의 오류를 저지를 확률을 β로 표기한다. 확률 (1 – β)를 검정력 (power of the test)이라고 부른다. 의사 결정의 오류 P-va.. 2023. 7. 17.
가설 (Hypothesis) 가설 (Hypothesis) 가설은 연구의 목적과 관련된 모집단, 분포, 모수 등에 관한 어떤 주장이나 설명하는 것을 말한다. 통계적 가설은 모집단의 모수(ex: 평균, 분산 등)에 대한 잠정적인 주장이다. 통계적 가설에서는 귀무 가설과 대립 가설을 설정해주어야 한다. 귀무 가설 (Null hypothesis) '아무런 차이가 없다', '전혀 효과가 없다'는 것을 주장하는 것으로, 영 가설이라고도 한다. 연구에서는 귀무 가설을 거부하기 위해 설정한다. 연구자가 보이고자 하는 주장 (대립 가설)을 증명할 수 없을 때 돌아가는 곳이다. H0으로 표기한다. 대립 가설 (Alternative hypothesis) 귀무가설이 기각될 경우 채택하는 가설로, '차이가 있다', '효과가 있다' 라고 주장하는 것이다. .. 2023. 7. 17.
G*Power 소G*Power G*Power는 통계적 검정력을 계산하는 데 사용되는 무료 소프트웨어이다. 이 프로그램은 t-검정, F-검정 및 카이-제곱 검정을 비롯한 다양한 통계 검정에 대한 검정력을 계산하는 기능을 제공한다. https://www.psychologie.hhu.de/arbeitsgruppen/allgemeine-psychologie-und-arbeitspsychologie/gpower에서 프로그램을 다운로드 할 수 있다. 2023. 7. 17.
신뢰 구간 (Confidence interval) 신뢰 구간 (Confidence interval) 통계학에서 신뢰 구간은 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법이다. 신뢰 구간은 보통 표본에서 산출된 통계와 함께 제공된다. 95% 신뢰 구간은 95% 신뢰할 수 있는 값의 범위로 모집단의 실제 평균을 포함한다. 자연적인 표본 추출 변동성으로 인해 표본 평균(CI의 중심)은 표본마다 다르다. 신뢰도는 특정 CI가 아니라 방법에 있다. 표본 추출 방법을 여러 번 반복하면 구성된 구간의 약 95%가 실제 모집단 평균을 캡처한다. 표본 크기가 커질수록 구간 값의 범위가 좁아진다. 즉, 작은 표본보다 훨씬 정확하게 평균을 알 수 있다. 정규 분포를 사용하여 이를 시각화할 수 있다. 예를 들어, 모집단 평균 값이 표본 평균에서 -2과 +2 표준 .. 2023. 7. 14.
피어슨 상관 계수 (Pearson correlation coefficient) 피어슨 상관 계수 (Pearson correlation coefficient) 두 수치 특징을 비교하기 위한 표준 도구는 일반적으로 상관 계수로 알려진 Pearson 상관 계수이다 (다른 상관 계수도 많이 있지만 이 상관 계수가 가장 일반적임). 이것은 두 개의 수치 특징 사이의 선형 연관 강도를 나타내는 수치이다. 형상 사이의 관계가 비선형적이면 이 상관 계수가 오해의 소지가 있을 수 있으므로 산점도와 상관 계수를 모두 검토하는 것이 항상 좋은 방법이다. Key Characteristics 이 계수의 주요 특성은 다음과 같다. 값은 항상 [-1, +1] 간격에 있다. 이 값은 형상 사이의 선형 관계의 강도를 나타낸다. -1에 가까운 값은 형상 사이의 강한 음의 관계를 나타내며, +1에 가까운 값은 형상.. 2023. 7. 13.
728x90
반응형
LIST