[問題] RNN無法收斂已刪文

看板DataScience作者clansoda (小笨)時間4年前 (2019/08/04 01:12)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串1/1

我目前在練習使用RNN來做各種NLP的應用，目前是使用bidirectional LSTM來做 sentiment analysis，雖然使用的是最基本的架構，但是我發現模型不會收斂我的架構是先有一個embedding layer來將text轉成embedding然後feed進一個兩層的bidirectional LSTM再將最後一個time series的output抽出來feed進一個兩層的forward NN然後產生prediction 使用的是Adam lr = 0.00001 mini_bacth_size = 128 我想過是不是因為我將left_to_right跟right_to_left的兩個sequence串起來所以才沒辦法收斂，我用了paper裡面的方法將兩個向量加起來也不行。我也試過把lr調小一點也不行，也試過forward NN只用一層也不行，也試過只用left_to_right 的LSTM也不行，想請問如果用layer normalization會比較好嗎我還沒試的原因是因為網路上的應用並沒有用到normalization就會收斂了我將我的data與code放在下面希望有經驗與有時間的前輩能給我一些建議 data https://bit.ly/2T2rm9Q code https://bit.ly/31juGQH -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 108.12.53.156 (美國) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1564852345.A.C1C.html

‣ 返回看板[ DataScience ] 研討

‣ 更多 clansoda 的文章

文章代碼(AID): #1THS1vmS (DataScience)