Non-Linear Activation(비 선형 함수) 의 사용 이유

activation function 을 사용하지 않는다면, neural network 에 아무리 많은 layer 들을 사용해도, 그냥 입,출력 레이어만 붙어있는 네트워크와 다를바가 없기 때문이다.

예시: 다음과 같이 비 선형 함수를 사용하지 않는 신경망이 있다고 가정하자.

|500

A.1.1) 가 주어질 때

A.1.2) 만약 를 계산하면 어떻게 될까?

B) Related

C) References