Data-driven Methodology/DS (Data Science)
[Data Science] 기술 통계와 통계적 추론
by goatlab
2022. 3. 7.
기술 통계와 통계적 추론
- 기술 통계
- 모집단으로 부터 추출한 샘플로 통계적 결과를 계산 하는 것
- '20대 남성의 평균키는 얼마인가?' 라는 질문에 대답하기 위해 국민 전체에서 20대 남성의 모든 키를 조사하는 것은 비용 및 시간상의 문제로 어렵기 때문에 300명 으로 샘플링하여 키를 조사
- 통계적 추론
- 기술 통계의 결과를 이용해서 모집단의 특성을 추출해 내는 것
- 앞에서 추출한 300명으로 평균키를 이용해 '20대 남성의 평균키'를 추론해 내는 것
|
기술 통계 (descriptive statistic)
- 주어진 자료로부터 주관을 배제하고 여러 특성을 수량화하여 객관적인 데이터로 나타내는 통계분석 방법론
- 샘플에 대한 특성인 평균, 표준편차, 중위수, 최빈값, 그래프, 왜도, 첨도 등을 구하는 것
- 통계량에 의한 자료 정리
- 중심위치의 측도
- 표본평균 (mean)
- 중앙값 (median)
- 최빈값 (mode)
- 산포의 측도
|
통계적 추론 (추측통계)
- 수집된 자료를 이용해 모집단에 대한 의사 결정을 하는 것으로 샘플을 통해 모집단을 추정하는 것
- 전수조사가 불가능하면 모집단에서 표본을 추출하고 표본을 근거로 확률론을 활용하여 모집단의 모수들에 대해 추론하는 것
- 모수추정
- 모집단의 특성인 모수 (평균, 분산 등)을 분석하여 모집단을 추론
- 가설검정
- 대상 집단에 대한 가설을 설정한 후 그 가설이 옳은지 그른지에 대한 채택여부를 결정하는 방법론
- 예측
- 미래의 불확실성을 해결해 효율적인 의사결정을 하기 위해 활용
- 회귀분석, 시계열 분석등의 방법이 있다.
|
https://wikidocs.net/48103