Gaussian Distribution
A.1) Single Variable
종종 값을 precision 으로 대체하여 표현한다.
A.2) D-dimensional Vector
차원 vector 의 데이터셋 에 대한 가우시안 분포는 multivariate Gaussian distribution 라고 부르며, pdf 는 다음과 같이 계산된다.
위 수식에 대한 notation 은 다음과 같다.
- 는 - 차원 mean vector
- 는 차원의 covariance matrix:
- covariance matrix 는 [positive-definite matrix](positive definite) 여야 한다.
Mahalanobis distance: covariance matrix
- 일반적으로 Gaussian distribution 이 잘 정의되기 (well defined) 위해선, covariance matrix 의 모든 eigenvalue 가 strictly positive 한 조건이 필요하다: positive definite
- 물론 일부 eigenvalue 가 0 인 case 도 있는데 이는 covariance matrix 가 positive semidefinite 일 경우를 의미한다.
B) Derivative of PDF
B.1) Multivariate Gaussian Distribution
trace trick 을 활용하여 미분을 진행할 수 있음
C) Sum of Normally Distributed Random Variables
가우시안 분포를 가지는 두 독립 변수 , 의 합 (sum) 도 가우시안 분포를 가진다.
즉, , 이고, 이면 를 만족한다.
subtraction 에도 적용할 수 있다: 이면
D) A Farewell to Epsilon
종종 Gaussian linear model 을 보면 이런식으로 표현하는 경우가 있다
이는 와 동일하다.
하지만 을 사용하는 방법은 별로 좋지않다. 왜냐하면 다른 분포에 대해서는 표현하지 못하기 때문에 general 한 면이 떨어진다.