Dirichlet Distribution

Dirichlet(디리클레) 분포는 Beta distribution 의 확장판

  • Beta 분포의 경우 에서 sample 을 뽑을 시 0 과 1 사이의 값이 나옴
  • Dirichlet 분포의 경우 vector 를 sampling 하고, vector 의 원소들은 모두 값을 가지며, 다 합치면 이 나옴
    • 즉, Dirichlet 의 sample space 에 존재하는 vector 는 확률 분포와 동일한 속성을 지닌다.
  • 디리클레 분포는 차원의 실수 벡터에서, 벡터의 원소가 양수이며 모든 요소를 더한 값이 1 인 경우에 확률값이 정의되는 연속확률분포이다.
  • pdf of Dirichlet distribution
    • Parameter 가 이면, 디리클레 분포의 pdf 는

이다.

Normalizing constant 는 multivariate beta function 으로, gamma function 으로 표현될 수 있다.

인 경우 Beta distribution 이다.

  • concentration parameter 값의 의미
    • 높은 값은 그 에 대해 더 많은 가중치가 존재함을 뜻한다.
    • 만약 가 모두 동일하다면, 그 분포는 symmetric 하다.
    • 이라면, 에서 멀어지는 anti-weight 의 정도로 생각할 수 있다.
    • 예시

: (a) , (b) , (c) , (d)

Four different samples from Dirichlet distributions. In %28a%29 the values are "uniformly" scattered all over the space, in %28b%29 they are clustered around the center, in %28c%29 they are clustered around one side %28alpha_2%29, and slightly shifted towards another %28alpha_3%29, in %28d%29 the values are drifting away from the center, towards the borders.

  • 특징
    • the Dirichlet distribution 는 multinomial distribution 그리고 categorical distributions 와 conjugate prior 관계이다. 그래서 Dirichlet 분포는 prior 분포로 사용할 수 있다.
    • 수식
      • multinomial 분포에 대한 likelihood 는 다음과 같이 계산

:

	* Dirichlet 분포의 prior는 다음과 같이 표현됨

:

	* conjugate prior 특성으로 인해, posterior는 Dirichlet 분포를 따르게 되는데, 이는 다음과 같음

:

두 분포에 대한 vector 표현을 서로 더한 것 (beta 분포와 Bernoulli distribution 의 관계와 동일)

  • [Maximum log-Likelihood Estimation](Maximum Likelihood Estimation) of Dirichlet distribution parameters
      • 는 관찰된 sufficient statistics
      • 해당 log-likelihood 함수는 에 대해 convex 하기 때문에 unique optimum 을 보장한다.
  • In Recommendation System
    • latent topic 에 대한 standard deviation 을 구하면 user 의 topic 에 대한 선호도가 적절히 분산되어있는지, 아니면 한쪽으로 편향되어 나타나는지 확인할 수 있다 (일반적으로 표준 편차가 작을수록 사용자의 선호도를 잘 구별하지 못한다고 생각할 수 있음).
    • 값이 클수록 각 사용자에 대해 더 많은 topic 이 할당되고, 작을수록 각 사용자에 대해 더 작은 topic (skew 된) 이 할당됨

2. Related

3. References

bayesian - What exactly is the alpha in the Dirichlet distribution? - Cross Validated