LSTM
GRU 보다 좀 더 복잡하고 강력한 memory cell
LSTM 은 GRU 에 비해 gate 가 많아서 성능이 좋지만, 계산량이 많아서 network 사이즈를 늘리기에는 부담이 크다.
B) The Figure of LSTM
단일 cell 모양

multiple cells

C) GRU 와 차이점
- GRU 와 달리 cell state 를 update 하기 위한 두 개의 gate , 를 가진다.
- relevant gate 가 없고 output gate 가 존재한다.
- GRU 는 이지만, LSTM 에서는 를 위해 output gate 와 tanh function 를 적용한다.
D) The Gates of LSTM
Output gate 는 출력 또는 다음 cell unit 으로 넘길 의 정도를 결정한다.
is a vector of dimension equal to the number of hidden units in the LSTM.
E) LSTM forward Propagation
- Update Gate:
- Forget Gate:
- Output gate:
F) Peephole Connection
peephole connection 이란, 각 gate 의 weight 에 곱해질 vector 에 이전 cell state 를 포함하는 방법을 말한다. 즉, 를 로 변경하는 방식이다.