자료의 표현
자료를 요약하고 단순한 통계 방법을 이용하여 분석한다. 그리고 적절한 통계 분석을 통해 통계적 추론은 상식에 맞아야 하며 기술통계적 방법 (descriptive statistics)부터 적용한다.
도표나 그래프의 이용할 때 분명하게 표시 (labeled)해야 하며, 자체적으로 설명 가능(self-explanatory) 해야한다. 너무 자세하지도, 너무 산만하지도 않게 적절하게 표현 (과장 표현은 금물)한다.
빈도표 (Frequency Table)
빈도표 (Frequency Table)는 자료를 요약해서 나타내주는 흔한 방 법 중 하나이다. 이 방법은 자료가 discrete (count)한 경우 많이 쓰인다. 일반적으로 절대 빈도나 상대 빈도가 많이 쓰인다.
절대 빈도 | 주어진 범주에 속한 개체의 숫자 |
상대 빈도 | 전체 개체의 숫자 중 주어진 범부에 속한 개체의 숫자 비율 |
그래프 (Graphs)
변수의 측정값에 대한 변동의 패턴을 분포 (distribution)이라고 한다. 이런 분포는 요약값이나 그래프를 이용하여 요약할 수 있다.
|
막대 그림 (Bar Charts)
각 범주 별로 관찰된 상대 빈도를 나타내는 데 사용된다. 막대 사이에는 공간이 있고 막대의 넓이는 다 같다. 명목형 변수인 경우는 막대의 순서는 상관없다.
히스토그램 (Histogram)
빈도 또는 상대 빈도를 표현한다. 먼저, 빈도 분포를 만든다. 이때, bin들은 같은 넓이를 가져야하고 구간은 서로 겹치지 않아야 한다. X축과 Y축을 생성한다. Y축은 0에서 시작한다. X축은 자료의 구간이 된다. 각각의 구간에 사각형의 bin을 만든다. 이때, 각 사각형의 높이 는 그 구간의 빈도 또는 상대 빈도가 된다.
원 도표 (Pie Chart)
명목형 변수나 순서형 변수의 빈도 또는 상대 빈도를 원 안에 나타낸다.
줄기-잎 그림 (Stem and leaf Plot)
히스토그램과 비슷하다. 하지만 실제값이 표시된다.
상자 그림 (Boxplot)
연속형 자료의 중위수, 산포, symmetry 등을 표시하거나 비교하는데 유용하다.
산점도 (Scatter Plot)
두 연속형 변수의 관계를 표현하는 데 유용하다.
'Biomedical & AI > Fuzzy logic in medicine' 카테고리의 다른 글
의료데이터 통계 (0) | 2022.11.04 |
---|---|
퍼지 집합 (2) (0) | 2022.05.09 |
퍼지 집합 (1) (0) | 2022.05.09 |
의학의 퍼지 논리 (0) | 2022.05.09 |