Post

확률 및 통계학 3. 확률과 확률분포

사건의 확률

  • 시행(trial): 결과가 우연에 의해 결정되는 실험이나 관찰
  • 표본공간(sample space, \(\Omega = \{\omega_1, \omega_2, \cdots, \omega_n\}\)): 주어진 시행에서 가능한 모든 결과들의 집합
  • 근원사건(elementary event): 표본공간을 구성하는 개개의 결과
  • 사건(event): 표본공간의 부분집합
    • 전사건: 어떤 사건에서 반드시 일어나는 사건
    • 공사건: 시행의 결과가 관측되지 않는 사건

사건 \(A\)의 확률

  • \(P(A)\): 한 가지 실험을 반복할 때 \(A\) 사건이 일어나는 횟수의 비율
  • 확률의 기본법칙
    • 모든 사건 \(A\)에 대해 \(0 \le P(A) \le 1\)
    • $P(A) = \sum_{\omega_i \in A} P(\omega_i)$
    • $P(\Omega) = \sum_{\omega_i \in \Omega} P(\omega_i) = 1$

확률법칙

  • 여사건(\(A^C\)): 사건 \(A\)에 포함되지 않은 근원사건들의 모임
  • 합사건(\(A \cup B\)): 사건 \(A\) 또는 \(B\)에 포함되는 근원사건들의 모임
  • 곱사건(\(A \cap B\)): 사건 \(A\)와 \(B\)에 동시에 포함되는 근원사건들의 모임
  • 배반사건(exclusive events): 두 사건의 공통 원소가 없는 경우, \(A \cap B = \varnothing\)
  • 합사건의 법칙: \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\)
  • 여사건의 법칙: \(P(A^C) = 1-P(A)\)
  • 예)

    \[\begin{matrix} \text{meterial} & \text{temperature} & \text{pressure}\\ 1 & 1000 & 2\\ 2 & 1000 & 3\\ 3 & 1500 & 2\\ 4 & 1500 & 2\\ \end{matrix}\]
    • 표본공간(2개 선택): \(\Omega = \{(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)\}\)
    • 같은 온도: \(A = \{(1, 2), (3, 4)\}\)
    • 같은 압력: \(B = \{(1, 3), (1, 4), (3, 4)\}\)
    • 온도와 압력이 모두 다른 사건: \(\Omega - (A \cup B) = \{(2, 3), (2, 4)\}\)
    • 온도와 압력이 모두 같은 사건: \(A \cap B = \{(3, 4)\}\)
    • 온도는 같고 압력이 다른 사건: \(A - B = A \cap B^C = \{(1, 2)\}\)
    • 온도가 다르거나 압력이 같은 사건: \(A^C \cup B = \{(1, 3), (1, 4), (2, 3), (2, 4), (3, 4)\}\)
    • 온도나 압력이 같을 확률: \(P(A \cup B) = P(A) + P(B) - P(A \cap B) = \frac{2}{6} + \frac{3}{6} - \frac{1}{6} = \frac{2}{3}\)
    • 온도가 다르거나 압력이 다를 확률: \(P(A^C \cup B^C) = 1 - P(A \cap B) = \frac{5}{6}\)

조건부확률

\[P(A \mid B) = \frac{P(A \cap B)}{P(B)}\]
  • 사건 \(B\)가 일어났을 때, 사건 \(A\)가 일어날 확률
  • 곱사건의 법칙: \(P(A \cap B) = P(A \mid B)P(B) = P(B \mid A)P(A)\)
  • 독립사상: \(A \perp B \Leftrightarrow P(A \mid B) = P(A) \; or \; P(B \mid A) = P(B)\)
    • $P(A \cap B) = P(A) \cdot P(B)$
  • 예)
    • 20명: 결제일 지킴(\(S\)), 5명: 결제일 안 지킴(\(F\)) -> 임의로 2명을 선택할 때, 한 명은 지키고 한 명안 안 지켰을 확률
      • $P(S_1 \cap F_2) + P(F_1 \cap S_2) = P(S_1)P(F_2 \mid S_1) + P(F_1)P(S_2 \mid F_1) = \frac{20}{25} \times \frac{5}{24} + \frac{5}{25} \times \frac{20}{24} = \frac{1}{3}$

표본공간 \(\Omega\)의 분할

  • \(B_i \cap B_j = \varnothing\), \(\Omega = B_1 \cup B_2 \cup \cdots \cup B_k\)이면 \(B_1, B_2, \cdots , B_k\)를 표본공간의 분할이라고 함

total_probability

  • 전확률의 정리: \(P(A) = P(B_1) \cdot P(A \mid B_1) + P(B_2) \cdot P(A \mid B_2) + \cdots + P(B_k) \cdot P(A \mid B_k)\)
  • 베이즈 정리

    \[P(B_i \mid A) = \frac{P(B_i) \cdot P(A \mid B_i)}{P(B_1) \cdot P(A \mid B_1) + P(B_2) \cdot P(A \mid B_2) + \cdots + P(B_k) \cdot P(A \mid B_k)}\]
  • 예)

    \[\begin{matrix} \text{factory} & \text{ratio} & \text{defect rate}\\ A_1 & 30\% & 2\%\\ A_2 & 50\% & 1\%\\ A_3 & 20\% & 5\%\\ \end{matrix}\]
    • 세 공장의 제품 중 하나를 골랐을 때 불량일 확률

      \[\begin{align*} P(A) &= P(A_1) \cdot P(A \mid A_1) + P(A_2) \cdot P(A \mid A_2) + P(A_3) \cdot P(A \mid A_3)\\ &= 0.3 \cdot 0.02 + 0.5 \cdot 0.01 + 0.2 \cdot 0.05\\ &= 0.021\\ \end{align*}\]
    • 불량이 발생했을 때, \(A_1\) 공장에서 발생했을 확률

      \[P(A_1 \mid A) = \frac{P(A \cap A_1)}{P(A)} = \frac{P(A_1) \cdot P(A \mid A_1)}{P(A)} = \frac{0.3 \cdot 0.02}{0.021}\]

확률 변수

  • 확률 변수(random variable, \(X\)): 각각의 근원사건들에 실수값을 대응시키는 함수
    • 이산 확률 변수(discrete random variable): 확률 변수가 가질 수 있는 값이 이산적인 경우
    • 연속 확률 변수(continuous random variable): 확률 변수가 가질 수 있는 값이 연속적인 경우
  • 확률 분포(probability distribution): 확률 변수가 가질 수 있는 값에 확률을 대응시킨 관계
  • 확률 함수(probability function): 확률 변수의 각 값에 확률을 대응시키는 함수

이산 확률 변수

  • 확률 질량 함수(probability mass function, pmf): \(P(X = x_i) = p(x_i)\)
    • \(0 \le p(x_i) \le 1\), \(i = 1, 2, \cdots , n\)
    • $\sum_{i=1}^n p(x_i) = 1$
    • $P(a \lt X \le b) = \sum_{a \lt x \le b} P(X = x)$
  • 이산 확률 변수의 기대값
    • 평균: \(E(X) = \mu = \sum_x xp(x)\)
      • $E(a) = a$
      • $E(aX) = aE(X)$
      • $E(a + bX) = a + bE(X)$
      • $E(aX + bY) = aE(X) + bE(Y)$
    • 분산: \(Var(X) = E(X - \mu)^2 = \sum_x (x - \mu)^2 p(x) = \sum_x^n x^2 p(x) - \mu^2 = E(X^2) - (E(X))^2\)
      • $V(a) = 0$
      • $V(aX) = a^2 V(X)$
      • $V(a + bX) = b^2V(X)$
    • 표준 편차: \(sd(X) = \sqrt{Var(X)}\)

연속 확률 변수

  • 확률 밀도 함수(probability density function, pdf): \(f(x)\)
    • 모든 \(x\)에 대해, \(f(x) \ge 0\)
    • $P(a \le X \le b) = \int_a^b f(x)dx$
    • $P(-\infty \lt X \lt \infty) = \int_{-\infty}^{\infty} f(x) dx = 1$
  • 연속 확률 변수의 기대값
    • 평균: \(E(X) = \int_{-\infty}^{\infty} xf(x) dx = \mu\)
    • 분산: \(Var(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) dx = \sigma^2\)
    • 표준 편차: \(sd(X) = \sqrt{Var(X)} = \sigma\)

이산 확률 분포

이항 분포

  • 베르누이 실험: \(\Omega = \{0, 1 \}\)
    • 성공과 실패로만 결과가 나오는 실험
  • 베르누이 시행: 확률이 \(p\)로 일정한 베르누이 실험을 \(n\)번 반복하는 시행
    • 상호 배반
    • 서로 독립
  • 이항 실험: 베르누이 시행에서 성공 횟수를 세는 실험

Binomial_distribution_pmfBy Tayste - Own work, Public Domain

  • 확률 변수 \(X\): \(X \sim Bin(n, p)\)

  • 확률 질량 함수

    \[P(X) = \binom{n}{p} p^x q^{n-x}, \; x= 0, 1, \dots, n\]
    • \(p = 0.5\): 대칭
    • \(p\lt 0.5\): 오른쪽 꼬리
    • \(p \gt 0.5\): 왼쪽 꼬리
  • 평균: \(E(X) = np\)

  • 분산: \(Var(X) = npq\)

초기하 분포

  • 비복원 추출에서 \(N_1\)개의 목표가 포함된 \(N\)개의 모집단 중 \(n\)개를 추출할 때, 성공 횟수에 대한 확률 분포
    • 상호 배반
    • 비독립적
      • 예) 공을 뽑을 때, 공을 다시 넣지 않고 계속 추출

HypergeometricPDFBy Fuzzyrandom - Own work, CC BY-SA 4.0

  • 확률 변수 \(X\): \(X \sim Hypgeom(n, N_1, N)\)​

  • 확률 질량 함수

    \[P(X)=\frac{\binom{N_1}{x} \binom{N - N_1}{n - x}}{\binom{N}{n}}, \; x = \max(0, n - N + N_1), \dots, \min(n, N_1)\]
  • 평균: \(E(X) = n\frac{N_1}{N}\)​
    • \(p\)를 \(\frac{N_1}{N}\)로 생각
  • 분산: \(Var(X) = npq\left(\frac{N-n}{N-1}\right) = n \left(\frac{N_1}{N}\right) \left(1 - \frac{N_1}{N}\right) \left(\frac{N-n}{N-1}\right)\)

  • 초기하 분포 -> 이항 분포 근사
    • \(n \lt 0.005N\)이면 이항분포로 생각할 수 있음

포아송 분포

  • 단위 시간당 평균 발생률이 \(\lambda\)​인 사건의 발생 횟수

Poisson_pmfBy Skbkekas - Own work, CC BY 3.0

  • 확률 변수 \(X\): \(X \sim Po(\lambda)\)

  • 확률 질량 함수

    \[P(X)=\frac{e^{-\lambda}\lambda^x}{x!}\]
  • 평균: \(E(X) = \lambda\)
  • 분산: \(Var(X) = \lambda\)
  • 이항 분포 -> 포아송 분포 근사
    • \(n \ge 100\)이고 \(\lambda = E(X) = np \le 5\)이면 \(Bin(n, p) = Po(np)\)로 생각할 수 있음

연속 확률 분포

균등 분포

Uniform_Distribution_PDF_SVG

  • 확률 변수 \(X\): \(X \sim U(a, b)\)
  • 확률 밀도 함수

    \[f(x) = \begin{cases} \frac{1}{b - a}, & a \le x \le b \\ 0, & x \lt a \; or \; x \gt b \end{cases}\]
  • 평균: \(E(X) = \frac{a + b}{2}\)
  • 분산: \(Var(X) = \frac{(b - a)^2}{12}\)

정규 분포

Normal_Distribution_PDFBy Inductiveload

  • 확률 변수 \(X\): \(X \sim N(\mu, \sigma^2)\)
  • 확률 밀도 함수

    \[f(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x - \mu)^2}{2\sigma^2}}, \; -\infty \lt x \lt \infty\]
  • 정규 분포 확률 밀도 함수의 특징
    • 종 모양
    • 아래쪽 영역의 총면적은 항상 1
    • 평균은 함수의 중앙에 위치하며, 평균에 대해 좌우 대칭이고, 평균에서 최댓값
    • 평균, 중위수, 최빈값은 모두 같은 값
    • 정규 분포의 모양과 위치는 평균과 표준편차에 의해 달라짐
  • 이항 분포 -> 정규 분포
    • \(np \gt 5\)이고, \(nq \gt 5\)이면 \(X \sim N(np, npq)\)로 생각할 수 있음
    • 연속성 수정: 이산형 분포를 연속형으로 근사할 때 양 끝이 버려져 발생하는 오차를 해결하는 방법

      \[P(a \le X \le b) \rightarrow P(a - 0.5 \le X \le b + 0.5)\]

표준 정규 분포

  • 확률 변수 \(Z\): \(Z = \frac{X - \mu}{\sigma} \sim N(0, 1)\)
  • 정규 분포를 z-score에 대입하여 변환한 정규 분포
  • 서로 다른 평균과 표준편차를 가진 정규 분포를 비교할 수 있도록 해줌
This post is licensed under CC BY 4.0 by the author.