LSTM

GRU 보다 좀 더 복잡하고 강력한 memory cell

LSTM 은 GRU 에 비해 gate 가 많아서 성능이 좋지만, 계산량이 많아서 network 사이즈를 늘리기에는 부담이 크다.

B) The Figure of LSTM

단일 cell 모양
image-20201101213612591

multiple cells
image-20201101213643402

C) GRU 와 차이점

  • GRU 와 달리 cell state 를 update 하기 위한 두 개의 gate , 를 가진다.
  • relevant gate 가 없고 output gate 가 존재한다.
  • GRU 는 이지만, LSTM 에서는 를 위해 output gate 와 tanh function 를 적용한다.

D) The Gates of LSTM

Output gate 는 출력 또는 다음 cell unit 으로 넘길 의 정도를 결정한다.
is a vector of dimension equal to the number of hidden units in the LSTM.

E) LSTM forward Propagation

  • Update Gate:
  • Forget Gate:
  • Output gate:

F) Peephole Connection

peephole connection 이란, 각 gate 의 weight 에 곱해질 vector 에 이전 cell state 를 포함하는 방법을 말한다. 즉, 로 변경하는 방식이다.

G) Related

H) References