OLS

MSE 를 cost function 으로 가지는 선형 회귀 모델에 대한 closed form solution

다음과 같은 선형 회귀 모델에 대한 RSS 가 있다고 해보자.

이를 미분해서 gradient 를 구하면 다음과 같다.

이제 gradient 를 0 으로 설정하면 normal equations 이라고 알려진 다음과 같은 식을 얻는다:

최적의 솔루션은 의 범위에 대해 normal (orthogonal) 한 것이다.

즉, 에 대한 solution OLS 는 아래와 같다.

이는 system of linear equations 에서 일때, 을 찾는 것과 같다.

B) OLS 는 Unique Global Minimum 을 가지는가?

OLS 의 solution 이 unique 한지 확인하기 위해서는 parameter Hessian matrixpositive definite 한지 알아보면 된다

만약 가 full [rank](the rank of a matrix) 인 경우, positive definite 하다.

여기서 full rank 인 경우는 의 rank 가 를 만족한다는 의미이고, positive definite 는 에 대해 를 만족한다는 의미이다.

C) Computing Issue

인 경우 QR decomposition 을 통해 좀 더 빠르게 계산하는 방법이 있다: where

  • OLS 는 the system of linear equations 을 푸는 것과 동일하다는 점을 고려했을 때 QR decomposition 을 이용하면 다음과 같이 계산할 수 있다

이때, 은 upper triangular 이므로, backsubstitution 을 이용하면 matrix inversion 없이 equation 을 풀 수 있다.

other approaches: conjugate gradient, GMRES (generalized minimal residual method)

  • Important issue
    • model 을 fitting 하기 전에, input feature 를 z-score 형태로 만드는 것이: zero mean and unit variance.

D) Solving for Offset and Slope Separately

에서 를 동시에 계산하는 방법 ( column vector 추가) 도 있지만, 따로 계산할 수 있다.

  • 는 centered input matrix 로, 행이 으로 구성됨 ( 는 centered output)
  • 를 centered data 에 대해 계산하고, 를 통해 bias 를 계산

E) 단점

가 invertible 하지 않는 경우, 즉 singular 인 경우는 잘 동작하지 않는다.

이런 경우는 대부분 ( matrix) 이거나 일부 feature 가 불필요하는 경우다.

F) Related

G) References