Re: [討論] 關於 Dcard ML 實習作業

看板Soft_Job作者EvilSD (星塵遠征君)時間11月前 (2023/05/15 21:35)推噓7(8推 1噓 23→)

留言32則, 7人參與討論串2/2 (看更多)

: 題目是用結構資料，包含標題、看板資訊以及1-6小時的愛心數和評論數等等 : 來預測發文後 24 小時的愛心數來雲一下我可能會怎麼做如果假設我沒理解錯誤題目的話，應該基於給予的前六小時的資料，去預測未來24小時候的愛心數吧? 首先這題目我可能就不會考慮用NLP來做處理，主要是資料量可能不足再加上中文NLP來做除了麻煩外效果可能也不會太好想法是有了1~6小時的愛心數跟評論量，預測未來24小時的愛心數基本上標題文字的意義其實可能就不是那麼重大，有強烈特徵的可能只是一兩個關鍵字而且有了前六小時的數據，基本上不用標題也能夠推估未來的數字所以覺得這題比較難的是，你沒有6小時之後的資料，所以很難預估一個趨勢 (除非有給完整趨勢資料) 因此我會將看板資訊轉成單純數字的Label，或是可以取得與看版相關的人氣值正規化後做代替將標題做關鍵字提取，並且做文字雲把重複的強烈關鍵字與留言愛心數做對應，重新建一個特徵值接下來就有完整的特徵值資料，做一下特徵值的關聯性或是強度分析挑幾個覺得強烈的出來訓練一個模型即可(ML與DL都可以) (應該用LSTM效果比較好) 基本上能簡單做就不會想太複雜處理，單純一個想法也確定可不可行，供大家討論參考 -- 那片有座高塔哭著朝北方奔去的天空，是我此刻片尋不著的風景 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.82.176 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1684157729.A.940.html

推

05/16 07:55, 11月前 , 1^F

05/16 07:55, 1^F

→

05/16 07:55, 11月前 , 2^F

05/16 07:55, 2^F

我不知道他們題目有沒有說可以拿外部資料，只為了符合遊戲規則而已如果是我理解這樣，這題目其實比較有點類似工業界的生命預估

推

05/16 07:56, 11月前 , 3^F

05/16 07:56, 3^F

→

05/16 07:57, 11月前 , 4^F

05/16 07:57, 4^F

→

05/16 07:58, 11月前 , 5^F

05/16 07:58, 5^F

推

05/16 08:02, 11月前 , 6^F

05/16 08:02, 6^F

能簡單就比較不會想複雜用，雖然不確定考官想要的方向是什麼

→

05/16 11:10, 11月前 , 7^F

05/16 11:10, 7^F

→

05/16 11:10, 11月前 , 8^F

05/16 11:10, 8^F

→

05/16 11:12, 11月前 , 9^F

05/16 11:12, 9^F

認同 ※ 編輯: EvilSD (59.120.53.15 臺灣), 05/16/2023 12:23:10

推

05/16 12:27, 11月前 , 10^F

05/16 12:27, 10^F

如果在NLP感覺至少也要數十萬以上才夠用但目前的題目是只要抓標題，文本量很少因此我猜五萬筆是足夠的只是如果今天拿去測外部資料會不會準，就不知道了

推

05/16 13:01, 11月前 , 11^F

05/16 13:01, 11^F

→

05/16 13:01, 11月前 , 12^F

05/16 13:01, 12^F

→

05/16 13:03, 11月前 , 13^F

05/16 13:03, 13^F

→

05/16 13:03, 11月前 , 14^F

05/16 13:03, 14^F

推

05/16 13:12, 11月前 , 15^F

05/16 13:12, 15^F

的確考量考官想看的差異度會很大，有些考官喜歡看新東西新技術，有些考官喜歡實用性

→

05/16 13:38, 11月前 , 16^F

05/16 13:38, 16^F

真是懷念XD 但依我原先的想法用BOW應該就是最直接的了 ※ 編輯: EvilSD (59.120.53.15 臺灣), 05/16/2023 14:01:23

推

05/17 13:58, 11月前 , 17^F

05/17 13:58, 17^F

→

05/17 13:58, 11月前 , 18^F

05/17 13:58, 18^F

噓

05/18 00:00, 11月前 , 19^F

05/18 00:00, 19^F

→

05/18 00:05, 11月前 , 20^F

05/18 00:05, 20^F

→

05/18 00:05, 11月前 , 21^F

05/18 00:05, 21^F

→

05/18 00:05, 11月前 , 22^F

05/18 00:05, 22^F

→

05/18 00:06, 11月前 , 23^F

05/18 00:06, 23^F

→

05/18 00:06, 11月前 , 24^F

05/18 00:06, 24^F

→

05/18 00:10, 11月前 , 25^F

05/18 00:10, 25^F

→

05/18 00:10, 11月前 , 26^F

05/18 00:10, 26^F

→

05/18 00:12, 11月前 , 27^F

05/18 00:12, 27^F

推

05/18 08:49, 11月前 , 28^F

05/18 08:49, 28^F

→

05/18 08:50, 11月前 , 29^F

05/18 08:50, 29^F

→

05/18 08:52, 11月前 , 30^F

05/18 08:52, 30^F

→

05/18 08:52, 11月前 , 31^F

05/18 08:52, 31^F

→

05/18 20:04, 11月前 , 32^F

05/18 20:04, 32^F

‣ 返回看板[ Soft_Job ] 工作

‣ 更多 EvilSD 的文章

文章代碼(AID): #1aOZKXb0 (Soft_Job)

討論串 (同標題文章)

本文引述了以下文章的的內容：

討論

12

48

[討論] 關於 Dcard ML 實習作業關於 Dcard ML 實習作業

11月前, 05/14

完整討論串 (本文為第 2 之 2 篇)：

排序：最舊先 | 最新先 | 留言數

討論

12

48

[討論] 關於 Dcard ML 實習作業關於 Dcard ML 實習作業

11月前, 05/14

討論

7

32

Re: [討論] 關於 Dcard ML 實習作業 Re: 關於 Dcard ML 實習作業

11月前, 05/15

在新視窗開啟完整討論串 (共2篇)

‣ 返回看板[ Soft_Job ] 工作

‣ 更多 EvilSD 的文章

文章代碼(AID): #1aOZKXb0 (Soft_Job)