Posterior Predictive Distribution

사후 예측 분포 (posterior predictive distribution) 는 관측된 데이터를 조건으로 했을 때 관측될 가능성이 있지만 관측되지 않은 데이터에 대한 분포를 의미한다

는 관측된 데이터에 대한 posterior

끝의 식에서 가 사라진 이유는, 관측되지 않은 데이터와 기존 데이터는 독립이라는 가정이 있기 때문이다.
첫번째 식에서 두번째 식으로 유도되는 이유는 sum ruleproduct rule 을 활용했기 때문

2. 예시

from stackoverflow

(a) 는 sum rule, (b) 는 product rule 을 활용함

사후 예측 분포의 다른 표현들

the observed data:

  • plug-in approximation
    • posterior predictive distribution 의 계산 비용이 비싸기 때문에, MLE 같이 하나의 best model 이 존재한다고 가정하는 방식
      • , 는 Dirac delta function
    • 단점: overfitting and overconfidence

3. Related

4. References