728x90 반응형 SMALL 상태 저장소1 [ANN] LSTM (Long-Short Term Memory) LSTM (Long-Short Term Memory) 실제로 단순한 RNN은 장기적인 종속성 학습에서 문제를 겪는다. RNN은 일반적으로 역전파를 통해 훈련되며, 여기서 소실 (vanishing) 또는 폭주 (exploding)하는 기울기 문제에 직면할 수 있다. 이러한 문제는 신경망 가중치가 너무 작아지거나 너무 커지는 현상을 유발하기 때문에 장기적인 관계를 학습하기에는 효과적이지 않다. Vanishing Gradient Problem을 극복하는 특수한 RNN 유형이 장단기 기억 (LSTM) 신경망이다. LSTM 신경망은 부가적인 게이트를 사용하여 은닉 셀의 어느 정보가 출력과 다음 은닉 상태까지 보내지는지를 제어한다. 이를 통해 신경망은 데이터의 장기적인 관계를 더 효과적으로 학습할 수 있다. L.. 2022. 10. 11. 이전 1 다음 728x90 반응형 LIST