Xavier Initialization
neural network 의 weight 초기화 방법
모든 layer 에 대해서 다음과 같이 weight 와 bias 값을 초기화
즉, layer 의 모든 weights 는 Gaussian distribution 에서 mean 이 이고 variance 가 인 값을 sampling 한 것과 같다 ( 는 layer 의 neuron 개수).
B. Justification for Xavier Initialization
왜 학습이 잘될까?
- 읽다가 졸려서 못 읽겠어..