Exponential Family

랜덤 변수 의 분포가 exponential family 를 따른다고 했을때, pdf 는 다음과 같이 쓰여질 수 있다.

  • 은 vector of parameters
  • 는 scaling 상수. base measure 로도 불리며, 주로 의 값을 가짐
  • sufficient statistics
  • 은 the log partition function
  • 하고 는 뭔지 잘 모르겠음

B) 예시

랜덤 변수 를 parameter 로 가지는 Dirichlet distribution 를 따른다고 가정하면, pdf 는 다음과 같이 쓸 수 있다.

위 식은 계산을 편하게 만들기 위해 에 log 를 붙이고 exp 에 올린듯 하다:

			- $\eta=\alpha-1$

			- $A(\eta)=\sum_{k}\log\Gamma\left(\alpha_{k}\right)-\log\Gamma\left(\sum_{k}\alpha_{k}\right)$

			- $T(\theta)=\log\theta$
  • Properties
    • 는 정의를 활용하면 다음과 같이 쓰여질 수 있다.
    • 에 대해 한번 미분하면 에 대한 expectation 을 찾을 수 있다:
    • 에 대해 두번 미분하면 에 대한 variance 을 찾을 수 있다:
    • 예시: Dirichlet distribution
      • 위 예시에서 Dirichlet 분포를 따르는 log 랜덤 변수의 expectation 은 다음과 같이 계산할 수 있다.
          • 는 digamma function 으로, log gamma 의 first derivative 다.
  • notation of other paper
    • Generalized Linear Model 을 다루는 논문에서는 exponential family 분포의 density 가 다음과 같이 표현된다.
        • 여기서 는 context feature vector 이고, 는 response 를 의미한다.
          • 주로 이런 관계가 성립한다:
            • 는 strictly increasing link function (e.g. linear, sigmoid etc.)
      • 와 비교
        • 위 식에서 와 같다.
          • 그래서 그리고 를 만족한다고 한다.

C) Related

D) References