Multinomial Distribution

다항분포 (multinomial distribution) 란, 여러 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포를 의미한다. 예를 들어, $k$ 면을 가진 주사위를 $n$ 번 굴렸을 때, 각 면이 나타날 수 있는 횟수에 대한 확률을 모델링 할 수 있다.

A.1) 가정

$n$ 번의 독립적 실행 (trial) 이다.
각 trial 에는 $k$ 사건 중 하나가 상호 독립적 (mutually exclusive) 으로 발생한다.
하나의 실행에서, $k$ 의 outcome 들이 나올 각 확률들: $p_{1}, \dots, p_{k}$ 은 $\sum_{i = 1}^{k} p_{i} = 1$ 을 만족한다.

B) PMF of Multinomial Distribution

랜덤 변수 $X_{i}$ 는 outcome $i$ 에 대한 발생 횟수라고 가정하자. 이때, multinomial 분포에 대한 PMF 는 다음과 같다.

P (X_{1} = x_{1}, \dots, X_{k} = x_{k}) = \frac{n !}{x _{1} ! \dots x _{k} !} p_{1}^{x_{1}} \dots p_{k}^{x_{k}}

여기서 $n$ 은 총 발생 횟수의 합 $\sum_{i = 1}^{k} x_{i} = n$ 을 의미한다.

Multinomial distribution 은 a generalization of the Binomial Distribution 이다. 만약 $k$ 가 2 이고, $n$ 이 1 이라면, the multinomial distribution 은 Bernoulli distribution 이다. 그리고 $k$ is 2 and $n$ is bigger than 1, it is the Binomial Distribution.

C) 예시

어떤 나라의 선거에 세 번의 후보가 참가했다고 가정하자. 후보 A, B, C 는 각각 20%, 30%, 50% 를 투표로 받았다.

만약 6 명의 지지자들이 세 후보자 중 임의로 선택한다면, 후보 A, B, C 에 대한 각 지지자가 1, 2, 3 명일 확률은 얼마나 되는가?

Pr (A = 1, B = 2, C = 3) = \frac{6 !}{1 ! 2 ! 3 !} (0. 2^{1}) (0. 3^{2}) (0. 5^{3}) = 0.135

D) Expected Value and variance

expected value of times the outcome $i$ was observed over $n$ trials is $E (X_{i}) = n p_{i}$ .

variance: $Var (X_{i}) = n p_{i} (1 - p_{i})$

E) MLE Parameter of Multinomial Distribution

$K$ 개의 선택지가 있는 $N$ 개의 데이터 $x_{1}, \dots x_{n}$ 이 주어졌을 때, 해당 데이터들의 likelihood 를 최대화 (MLE) 하는 vector $p$ 를 찾으면?

Maximize $P (X ∣ p) = \prod_{n = 1}^{N} \prod_{k = 1}^{K} p_{k}^{x_{nk}} = \prod_{k = 1}^{K} p_{k}^{\sum_{n = 1}^{N} x_{nk}} = \prod_{k = 1}^{K} p_{k}^{m_{k}}$

$m_{k} = \sum_{n = 1}^{N} x_{nk}$
Subject to $p_{k} \geq 0, \sum_{k} p_{k} = 1$ (constraint)

Lagrange multiplier method 를 이용해서 풀어보자.

L (μ, m, λ) = k = 1 \sum K m_{k} ln p_{k} + λ (k = 1 \sum K p_{k} - 1)

이후 $p_{k}$ 에 대해 미분하여 0 이 되는 값을 찾는다.

\frac{d}{d p _{k}} L (μ, m, λ) = \frac{m _{k}}{p _{k}} + λ = 0 \to p_{k} = - \frac{m _{k}}{λ}

$k \sum p_{k} = 1$ 라는 constraint 를 활용하면 아래와 같이 유도할 수 있다.

k \sum - \frac{m _{k}}{λ} = 1 \to k \sum m_{k} = - λ \to k \sum n = 1 \sum N x_{nk} = - λ \to N = - λ

여기서 $\sum_{k} \sum_{n = 1}^{N} x_{nk} = N$ 인 이유는 다음과 같은 예시로 생각해볼 수 있다: 4( $k$ ) 지선다 답을 10( $N$ ) 문제 풀었을 경우 각 문제의 선택 확률 ( $x_{nk}$ ) 들은 선택한 값만 1 그리고 나머지는 0 값으로 나오고, 이것을 모두 합치면 결국 $N$ 이 된다.

결과적으로 $p_{k} = - \frac{m _{k}}{λ} = \frac{m _{k}}{N}$ 가 된다.

G) References

wiki

Zzong's Notes

탐색기

multinomial distribution

Multinomial Distribution

A.1) 가정

B) PMF of Multinomial Distribution

C) 예시

D) Expected Value and variance

E) MLE Parameter of Multinomial Distribution

G) References

링크된 언급

목차

탐색기

multinomial distribution

Multinomial Distribution

A.1) 가정

B) PMF of Multinomial Distribution

C) 예시

D) Expected Value and variance

E) MLE Parameter of Multinomial Distribution

F) Related

G) References

링크된 언급

함께 보면 좋은 글

목차