Exponential Family
랜덤 변수 의 분포가 exponential family 를 따른다고 했을때, pdf 는 다음과 같이 쓰여질 수 있다.
- 은 vector of parameters
- 는 scaling 상수. base measure 로도 불리며, 주로 의 값을 가짐
- 은 sufficient statistics
- 은 the log partition function
- 하고 는 뭔지 잘 모르겠음
B) 예시
랜덤 변수 가 를 parameter 로 가지는 Dirichlet distribution 를 따른다고 가정하면, pdf 는 다음과 같이 쓸 수 있다.
위 식은 계산을 편하게 만들기 위해 에 log 를 붙이고 exp 에 올린듯 하다:
- $\eta=\alpha-1$
- $A(\eta)=\sum_{k}\log\Gamma\left(\alpha_{k}\right)-\log\Gamma\left(\sum_{k}\alpha_{k}\right)$
- $T(\theta)=\log\theta$
- Properties
- 는 정의를 활용하면 다음과 같이 쓰여질 수 있다.
- 를 에 대해 한번 미분하면 에 대한 expectation 을 찾을 수 있다:
- 를 에 대해 두번 미분하면 에 대한 variance 을 찾을 수 있다:
- 예시: Dirichlet distribution
- 위 예시에서 Dirichlet 분포를 따르는 log 랜덤 변수의 expectation 은 다음과 같이 계산할 수 있다.
-
- 는 digamma function 으로, log gamma 의 first derivative 다.
-
- 위 예시에서 Dirichlet 분포를 따르는 log 랜덤 변수의 expectation 은 다음과 같이 계산할 수 있다.
- 는 정의를 활용하면 다음과 같이 쓰여질 수 있다.
- notation of other paper
- Generalized Linear Model 을 다루는 논문에서는 exponential family 분포의 density 가 다음과 같이 표현된다.
-
- 여기서 는 context feature vector 이고, 는 response 를 의미한다.
- 주로 이런 관계가 성립한다:
- 는 strictly increasing link function (e.g. linear, sigmoid etc.)
- 주로 이런 관계가 성립한다:
- 여기서 는 context feature vector 이고, 는 response 를 의미한다.
- 와 비교
- 위 식에서 는 와 같다.
- 그래서 그리고 를 만족한다고 한다.
- 위 식에서 는 와 같다.
-
- Generalized Linear Model 을 다루는 논문에서는 exponential family 분포의 density 가 다음과 같이 표현된다.

