Covariance
covariance 는 두 변수가 얼마나 선형적으로 관계가 있는지 수치적으로 나타내는 값이다.
covariance 의 절대값이 높다면, 두 값이 많은 변동이 있고 동시에 평균으로부터 멀리 떨어져 있다는 것을 의미한다.
양의 covaraince 는 두 값이 서로 양의 상관관계를 의미하고, 음의 covariance 는 음의 상관관계를 의미한다.
2. Correlation 과 관계
correlation 은 covariance 의 normalized 된 형태이다.
3. Covariance 계산 방법
3.1. For Univariate
The covariance between two univariate random variables is given by the expected product of their deviations from their respective means
Linearity of expectation(expectation > Linearity of expectation) 에 의해서 위 식은 다음과 같이 다시 쓸 수 있다: the expected value of the product minus the product of the expected values)
3.2. For Multivariate
If we consider two multivariate random variables and with states and covariance respectively, the covariance between and is defined as
4. Variance 와 관계
어떤 변수의 자기 자신에 대한 covariance 를 variance 라고 한다.
4.1. For Univariate
이고, 일때, 는 variance 라고 하며, 로 표현된다.
4.2. For Multivariate
multivariate 의 variance 경우는 다음과 같이 covariance 의 matrix 로 표현한다.
- covariance 의 대각 원소들은 variance 를 의미한다:
5. Regression 과 관계
linear regression 의 기울기 은 에 대한 분산을 와 의 공분산으로 나눈 것이다.
6. Covariance Matrix
covariance matrix 는 우리에게 데이터가 얼마나 퍼져 (spread) 있는지 알려주는 역할을 한다.
6.1. 특징
symmetric 이며, positive semi-definite 하다. covariance matrix 의 대각 원소는 marginals 의 variance 를 나타낸다.
- 는 만 제외하고 모두라는 뜻
- 대각 원소가 아닌 다른 원소들은 cross-covariance : for
Empirical covariance matrix
- 모집단이 아니라 샘플에 의해 계산되는 크기가 인 공분산 행렬을 의미 ( 크기가 )
covariance matrix 의 종류
- full : 개의 원소를 가진 공분산 행렬 (대각선 절반이 가득 찬 행렬)
- diagonal : 개의 원소를 가진 공분산 행렬 (diagonal matrix)
- spherical 또는 isotropic: , one free parameter 에 의해 좌우되는 공분산 행렬