확률 및 통계학 4. 표본 추출
전수조사와 표본조사
- 전수조사: 모집단 전체에 대해 조사
- 표본조사: 모집단 중 일부(표본집단)에 대해 조사
- 표본오차: 모집단 전체가 아닌 표본을 사용하기 때문에 발생하는 오차
- 비표본오차: 표본과 관련되지 않은 오차
- 예) 설문지, 조사원, 응답자 등에 의해 발생하는 오차
확률 추출법
단순임의추출법
- 크기가 \(N\)인 모집단으로부터 크기가 \(n\)인 표본을 비복원으로 추출
- 각 개체가 추출될 확률은 같음(\(\frac{1}{N}\))
- 방법의 가지수는 \(\binom{N}{n}\)가지
층화임의추출법
- 모집단의 개체들 중 비슷한 성질을 갖는 것끼리 층으로 분류하고, 각 층마다 단순임의추출법으로 추출
- 층끼리 중복되는 개체가 없도록 분류
계통추출법
- 모든 개체를 \(K\)(\(K = \frac{N}{n}\))개씩 \(n\)개의 구간으로 나누고, 각 구간에서 같은 위치에 있는 개체를 선택하여 추출
- 첫 구간에서 임의로 하나를 선택한 후, 해당 위치로부터 \(K\)번째마다 개체 추출
집락추출법
- 군집을 구분하고 군집별로 단순임의추출
확률크기비례추출법
- 집락추출법에서 군집의 크기에 차이가 큰 경우 그 규모에 비례하여 추출
표본오차와 표본분포
표본오차
- 모평균과 표본평균의 차이(\(e = \bar{x} - \mu\))
표본분포
- 표본평균과 같은 통계량의 분포
- 표본분포는 동일한 크기의 표본으로부터 계산된 모든 가능한 통계량의 분포를 나타냄
- 표본분포에 영향을 주는 요소
- 유한모집단인지, 무한모집단인지
- 모집단이 정규분포를 따르는지
- 복원으로 추출하는지, 비복원으로 추출하는지
표본평균의 표본분포
\[\mu_{\bar{x}} = E(\bar{x})=\mu\]- 일반적으로 모평균 \(\mu\)와 같음
표본평균 분산의 표본분포
\[\sigma^2_{\bar{x}}=\frac{\sigma}{n}\]
표본비율에 대한 표본분포
- 모집단이 이진분류일 때, \(A\)에 대한 비율 \(p\)의 표본분포
- 평균: \(\mu = p\)
- 분산: \(\sigma^2 = p(1 - p)\)
정규모집단에서의 표본추출
정규모집단: 정규분포를 따르는 모집단
\[N(\mu, \frac{\sigma^2}{n})\]CLT(Central Limit Theorem): 정규모집단으로부터 크키가 \(n\)인 임의 표본이 추출된다면, 표본평균의 표본분포는 정규분포를 따름
\[Z = \frac{\bar{x}-\mu}{\sigma / \sqrt{n}}\]- 일반적으로 \(n \ge 30\)이면 따름
표본평균을 표준화시킨 \(Z\)는 표준정규분포 \(N(0, 1)\)을 따름
t-통계량
- 모집단의 표준편차를 모르는 경우, 대신 표폰표준편차를 사용하는 통계량
- 자유도(\(df = n - 1\)): \(\bar{x}\)에 따라 값이 변하는 z 통계량에 반해, \bar{x}\(와\)s$$에 의해 값이 변하는 t 통계량의 분포(t 분포)를 설명하기 위한 모수
This post is licensed under CC BY 4.0 by the author.