데이터 분석에서 통계학의 중요한 역할은, 퍼짐(산포, dispersion)이 있는 데이터에 대해 설명이나 예측을 하는 것입니다. (24) 이러한 데이터 퍼짐은 대상이 가진 성질이나 관계성의 본모습을 감추고, 정확하게 파악할 수 없도록 합니다. 데이터 퍼짐에 의해 실제로는 약의 효과가 없는데도 불구하고 효과가 있다고 판단하는 오류나, 거꾸로 효과가 있음에도 효과가 없다고 판단하는 오류가 일어나기도 합니다. 통계학은 이러한 데이터 퍼짐을 '불확실성'이라 평가하고, 통계학의 목적인 '대상의 설명과 예측'을 수행합니다. (24) 모집단에서 추출한 표본은 유한한 개수의 요소를 포함합니다. 통계학에서는 표본에 포함된 요소의 개수를 표본크기(sample size)라 부르며, 보통 알파벳 n으로 나타냅니다. 예를 들어..