Xavier Initialization

neural network 의 weight 초기화 방법

모든 layer 에 대해서 다음과 같이 weight 와 bias 값을 초기화

즉, layer 의 모든 weights 는 Gaussian distribution 에서 mean 이 이고 variance 가 인 값을 sampling 한 것과 같다 ( layer 의 neuron 개수).

B. Justification for Xavier Initialization

왜 학습이 잘될까?

  • 읽다가 졸려서 못 읽겠어..

B.1. Joto Matthe

C. Related

D. References