[확률] (2) 확률 분포
Probability Distribution: 확률분포
확률 분포는 요구에 따라 값들을 생성하는 함수로 생각해도 된다. 값들은 무작위로 생성되지만, 각 값이 생성될 가능성은 주어진 확률 분포가 정의하는 패턴을 따른다. 예를 들어 어떤 확률 분포가 uniform distribution(균등분포)라면 그 확률분포를 따르는 사건들은 동일한 확률로 발생할것이다. 자주 쓰이는 확률분포들을 확인해보자
이산확률분포(Discrete Probability Distribution)
Binomial Distribution(이항분포)
의미
독립적이고 구체적 확률을 가지는 시행(trial)을 여러번 할 때 각 사건의 기대 빈도
발생 확률이 p인 사건이 n번의 시행 중 k번 발생할 확률을 수식으로 표현하면 아래와 같다.
\[P(X=k)= {n \choose k}p^{k}(1-p)^{n-k}\]${n \choose k}$기호는 $_nC_k$와 같은 의미인데, 이 분야에서는 이러한 LaTeX등 표기법을 더 자주 보게 될 것이다.
사건의 확률이 50%인 경우가 3번 중 3번 발생할 확률
예를 들어 동전을 세 번 던졌을 때 앞면이 세 번 나올 확률을 곱의 법칙과 이항분포 공식으로 계산하면 각각 아래와 같다
\[P(HHH)=(\frac{1}{2})(\frac{1}{2})(\frac{1}{2})=\frac{1}{8}=0.125\] \[P(HHH)={3\choose3}(0.5)^3(1-0.5)^{3-3}=1\times0.125\times1=0.125\]곱의 법칙으로 0.5를 세 번 곱하면 될 것을, 이항분포의 수식은 괜히 복잡해보인다.
사건의 확률이 $\frac{1}{3}$인 경우가 13번 중 7번 발생할 확률
사건의 확률이 0.5가 아니라면, 예를 들어 $\frac{1}{3}$이라면 어떨까? 이럴때는 이항분포가 도움이 된다. 예를 들어 게임 아이템 강화 확률이라고 생각해보자. 13번 강화해서 7번 성공할 확률을 계산하는 것이다.
\[P(X=7)={13\choose7}(\frac{1}{3})^7(1-\frac{1}{3})^{13-7}=0.0689=6.89\%\]Probability Mass Function(확률질량함수)
확률질량함수는 이산확률변수에서 확률변수가 특정 값을 가질 확률을 말해주는 함수이다. 예를 들어 강화 확률이 30%이고, 아이템 강화를 5회 시도했을 때 강화가 0번 성공할 확률부터 5번 성공할 확률은 아래와 같다.
\[P(X=0)={5\choose0}(0.3)^0(1-0.3)^{5-0}=0.1681=16.81\% \\ P(X=1)={5\choose1}(0.3)^1(1-0.3)^{5-1}=0.3601=36.01\% \\ P(X=2)={5\choose2}(0.3)^2(1-0.3)^{5-2}=0.3087=30.87\% \\ P(X=3)={5\choose3}(0.3)^3(1-0.3)^{5-3}=0.1323=13.23\% \\ P(X=4)={5\choose4}(0.3)^4(1-0.3)^{5-4}=0.0283=2.83\% \\ P(X=5)={5\choose5}(0.3)^5(1-0.3)^{5-5}=0.0024=0.24\%\]이 확률들은 하나의 확률 질량 함수(Probability Mass Function)을 규정한다. 위 값들은 n=5일 때 이항분포의 모든 가능한 값들이다.
베르누이 분포(Bernoulli Distribution)
이항분포의 특수 사례이다. 시행을 한 번만 하는 것이다. 머신러닝에서 다룰 일은 희박하니 넘어간다.
이항분포는 결국 베르누이 시행을 여러 번 한 것이므로 베르누이 분포에 대해 알아야 한다? 말장난이다.
푸아송 분포(Poisson Distribution)
단위 시간 또는 공간에서 발생하는 사건의 수를 모델링하는데 주로 쓰이는 이산확률분포이다.
Leave a comment