Bias

bias 는 데이터 내에 있는 모든 정보를 고려하지 않음으로 인해, 지속적으로 잘못된 것들을 학습하는 경향을 말한다.

어떤 모델을 학습시켰을 경우, 그 모델이 예측한 값과 실제 정답이 얼마나 멀리있는지를 나타내는가 생각해보면 된다. 너무 멀리있으면 (오답이 크면) high bias(underfitting), 가까이 있으면 (예측이 정확하면) low bias 이다.

B) Solution for High Bias

  • Bigger Network (모델에 complexity 를 추가)
  • Train Longer
  • NN architecture search (또 다른 신경망 구조를 탐색 및 시도)
  • High bias 상태에서 데이터를 추가하는 것은 아무 도움을 주지 않는다.

C) Bias in point Estimation

  • 개의 데이터로 추정한 parameter

C.1) Example: Estimators of the Variance of a Gaussian Distribution

으로 sample variance 를 추정하는 경우의 bias 는 다음과 같이 계산된다.

  • 즉, bias 는 으로, 위의 추정은 biased estimator 이다.

위 variance 추정 식 대신, 를 사용하면 unbiased 하게 나온다 (i.e. ). 하지만 unbased estimator 가 언제나 best 인것은 아니다.

D) Bias in Linear Model

RSS 가 다음과 같을 때,

bias(intercept) 는 일 때 expected value 를 의미한다.

E) Related

F) References