Posterior Predictive Distribution
사후 예측 분포 (posterior predictive distribution) 는 관측된 데이터를 조건으로 했을 때 관측될 가능성이 있지만 관측되지 않은 데이터에 대한 분포를 의미한다
는 관측된 데이터에 대한 posterior
끝의 식에서 가 사라진 이유는, 관측되지 않은 데이터와 기존 데이터는 독립이라는 가정이 있기 때문이다.
첫번째 식에서 두번째 식으로 유도되는 이유는 sum rule 과 product rule 을 활용했기 때문
2. 예시
(a) 는 sum rule, (b) 는 product rule 을 활용함
사후 예측 분포의 다른 표현들
the observed data:
- plug-in approximation
- posterior predictive distribution 의 계산 비용이 비싸기 때문에, MLE 같이 하나의 best model 이 존재한다고 가정하는 방식
- , 는 Dirac delta function
- 단점: overfitting and overconfidence
- posterior predictive distribution 의 계산 비용이 비싸기 때문에, MLE 같이 하나의 best model 이 존재한다고 가정하는 방식