Multinomial Distribution

다항분포 (multinomial distribution) 란, 여러 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포를 의미한다. 예를 들어, 면을 가진 주사위를 번 굴렸을 때, 각 면이 나타날 수 있는 횟수에 대한 확률을 모델링 할 수 있다.

A.1) 가정

  • 번의 독립적 실행 (trial) 이다.
  • 각 trial 에는 사건 중 하나가 상호 독립적 (mutually exclusive) 으로 발생한다.
  • 하나의 실행에서, 의 outcome 들이 나올 각 확률들: 을 만족한다.

B) PMF of Multinomial Distribution

랜덤 변수 는 outcome 에 대한 발생 횟수라고 가정하자. 이때, multinomial 분포에 대한 PMF 는 다음과 같다.

여기서 은 총 발생 횟수의 합 을 의미한다.

Multinomial distribution 은 a generalization of the Binomial Distribution 이다. 만약 가 2 이고, 이 1 이라면, the multinomial distribution 은 Bernoulli distribution 이다. 그리고 is 2 and is bigger than 1, it is the Binomial Distribution.

C) 예시

어떤 나라의 선거에 세 번의 후보가 참가했다고 가정하자. 후보 A, B, C 는 각각 20%, 30%, 50% 를 투표로 받았다.

만약 6 명의 지지자들이 세 후보자 중 임의로 선택한다면, 후보 A, B, C 에 대한 각 지지자가 1, 2, 3 명일 확률은 얼마나 되는가?

D) Expected Value and variance

expected value of times the outcome was observed over trials is .

variance:

E) MLE Parameter of Multinomial Distribution

개의 선택지가 있는 개의 데이터 이 주어졌을 때, 해당 데이터들의 likelihood 를 최대화 (MLE) 하는 vector 를 찾으면?

Maximize

  • Subject to (constraint)

Lagrange multiplier method 를 이용해서 풀어보자.

이후 에 대해 미분하여 0 이 되는 값을 찾는다.

라는 constraint 를 활용하면 아래와 같이 유도할 수 있다.

여기서 인 이유는 다음과 같은 예시로 생각해볼 수 있다: 4() 지선다 답을 10() 문제 풀었을 경우 각 문제의 선택 확률 () 들은 선택한 값만 1 그리고 나머지는 0 값으로 나오고, 이것을 모두 합치면 결국 이 된다.

결과적으로 가 된다.

F) Related

G) References