Post

확률 및 통계학 4. 표본 추출

전수조사와 표본조사

  • 전수조사: 모집단 전체에 대해 조사
  • 표본조사: 모집단 중 일부(표본집단)에 대해 조사
    • 표본오차: 모집단 전체가 아닌 표본을 사용하기 때문에 발생하는 오차
    • 비표본오차: 표본과 관련되지 않은 오차
      • 예) 설문지, 조사원, 응답자 등에 의해 발생하는 오차

확률 추출법

단순임의추출법

  • 크기가 \(N\)인 모집단으로부터 크기가 \(n\)​인 표본을 비복원으로 추출
    • 각 개체가 추출될 확률은 같음(\(\frac{1}{N}\))
  • 방법의 가지수는 \(\binom{N}{n}\)가지

층화임의추출법

  • 모집단의 개체들 중 비슷한 성질을 갖는 것끼리 층으로 분류하고, 각 층마다 단순임의추출법으로 추출
    • 층끼리 중복되는 개체가 없도록 분류

계통추출법

  • 모든 개체를 \(K\)(\(K = \frac{N}{n}\))개씩 \(n\)개의 구간으로 나누고, 각 구간에서 같은 위치에 있는 개체를 선택하여 추출
    • 첫 구간에서 임의로 하나를 선택한 후, 해당 위치로부터 \(K\)번째마다 개체 추출

집락추출법

  • 군집을 구분하고 군집별로 단순임의추출

확률크기비례추출법

  • 집락추출법에서 군집의 크기에 차이가 큰 경우 그 규모에 비례하여 추출

표본오차와 표본분포

표본오차

  • 모평균과 표본평균의 차이(\(e = \bar{x} - \mu\))

표본분포

  • 표본평균과 같은 통계량의 분포
  • 표본분포는 동일한 크기의 표본으로부터 계산된 모든 가능한 통계량의 분포를 나타냄
  • 표본분포에 영향을 주는 요소
    • 유한모집단인지, 무한모집단인지
    • 모집단이 정규분포를 따르는지
    • 복원으로 추출하는지, 비복원으로 추출하는지
  • 표본평균의 표본분포

    \[\mu_{\bar{x}} = E(\bar{x})=\mu\]
    • 일반적으로 모평균 \(\mu\)와 같음
  • 표본평균 분산의 표본분포

    \[\sigma^2_{\bar{x}}=\frac{\sigma}{n}\]

표본비율에 대한 표본분포

  • 모집단이 이진분류일 때, \(A\)에 대한 비율 \(p\)의 표본분포
  • 평균: \(\mu = p\)
  • 분산: \(\sigma^2 = p(1 - p)\)

정규모집단에서의 표본추출

  • 정규모집단: 정규분포를 따르는 모집단

    \[N(\mu, \frac{\sigma^2}{n})\]
  • CLT(Central Limit Theorem): 정규모집단으로부터 크키가 \(n\)​인 임의 표본이 추출된다면, 표본평균의 표본분포는 정규분포를 따름

    \[Z = \frac{\bar{x}-\mu}{\sigma / \sqrt{n}}\]
    • 일반적으로 \(n \ge 30\)이면 따름
  • 표본평균을 표준화시킨 \(Z\)는 표준정규분포 \(N(0, 1)\)​을 따름

t-통계량

  • 모집단의 표준편차를 모르는 경우, 대신 표폰표준편차를 사용하는 통계량
\[t=\frac{\bar{x} - \mu}{s / \sqrt{n}}\]
  • 자유도(\(df = n - 1\)): \(\bar{x}\)에 따라 값이 변하는 z 통계량에 반해, \bar{x}\(와\)s$$에 의해 값이 변하는 t 통계량의 분포(t 분포)를 설명하기 위한 모수
This post is licensed under CC BY 4.0 by the author.