[問卦] 請問時間序列跟迴歸模型能混用嗎?已回收

看板Gossiping作者 (jerry)時間5年前 (2018/11/14 17:46), 編輯推噓5(9416)
留言29則, 12人參與, 5年前最新討論串1/1
是這樣的啦 最近在Kaggle遇到了一個問題 資料很複雜 稍微簡化一下 方便舉例 現在有5個變數: 1. 消費額 2. 消費的時間(時間軸) 3. 顧客id 4. 網頁點擊次數 5. 所在城市 目標是 針對不同的顧客id 去預測其未來的消費額 既然要預測未來的話 第一個想到是用時間序列來解 但問題來了 給定未來的時間 當然 可以預測未來的消費額 但再多給個顧客id怎麼辦? 可以只拿兩個變數 去預測消費額嗎? 我的意思是 時間序列 是單純給時間這1個變數去預測 迴歸 是給全部的4個變數 去預測消費額 那可以只給2個 或3個變數 來預測嗎? 又 顧客id這個欄位 要當成類別變數嗎? 轉成dummy感覺完全沒意義 另外 這種問題 多變數時間序列 要用哪種模型來跑? Vector AutoRegression? Linear Mixed Model? 還是用隨機森林? 有沒有大神可以幫忙解惑的 十分感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 104.33.211.196 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1542188779.A.10E.html

11/14 17:46, 5年前 , 1F
作業自己寫
11/14 17:46, 1F

11/14 17:47, 5年前 , 2F
講中文
11/14 17:47, 2F

11/14 17:49, 5年前 , 3F
try panel data
11/14 17:49, 3F

11/14 17:50, 5年前 , 4F
隨機森林聽起來好潮 就用這個了
11/14 17:50, 4F

11/14 17:50, 5年前 , 5F
這裡是八
11/14 17:50, 5F

11/14 17:51, 5年前 , 6F
跑VAR啦
11/14 17:51, 6F

11/14 17:52, 5年前 , 7F
or longitutional
11/14 17:52, 7F

11/14 17:52, 5年前 , 8F
八卦板難得清新
11/14 17:52, 8F

11/14 17:54, 5年前 , 9F
去TT1069查啦
11/14 17:54, 9F

11/14 17:59, 5年前 , 10F
推三樓panel data
11/14 17:59, 10F

11/14 18:02, 5年前 , 11F
因為你多變量還要考慮變量檢定所以用
11/14 18:02, 11F

11/14 18:02, 5年前 , 12F
三樓的方式吧
11/14 18:02, 12F

11/14 18:04, 5年前 , 13F
最簡單就分2次跑囉,先跑時間數列,第
11/14 18:04, 13F

11/14 18:04, 5年前 , 14F
第二次再跑迴歸分析,省去一堆解釋
11/14 18:04, 14F

11/14 18:05, 5年前 , 15F
有些不要拿太複雜模型跑,自我麻煩
11/14 18:05, 15F

11/14 18:05, 5年前 , 16F
ps 你還要考慮不随時間變化的個體效果
11/14 18:05, 16F

11/14 18:06, 5年前 , 17F
像古代一堆論文拿"因果關係模型",結果
11/14 18:06, 17F

11/14 18:06, 5年前 , 18F
變一堆垃圾論文
11/14 18:06, 18F

11/14 18:08, 5年前 , 19F
LSTM噴下去
11/14 18:08, 19F

11/14 18:09, 5年前 , 20F
如果商學院,這些變數不用加跑時間數列
11/14 18:09, 20F

11/14 18:10, 5年前 , 21F
頂分時間帶重複跑三次迴歸分析就好了
11/14 18:10, 21F

11/14 18:14, 5年前 , 22F
建議不要分開跑,很難解釋
11/14 18:14, 22F

11/14 18:14, 5年前 , 23F
panel data應該是最佳
11/14 18:14, 23F

11/14 18:16, 5年前 , 24F
我都用挪威的森林
11/14 18:16, 24F

11/14 18:21, 5年前 , 25F
你照時間切開跑多次回歸其實是pooled cro
11/14 18:21, 25F

11/14 18:21, 5年前 , 26F
sssectional的資料
11/14 18:21, 26F

11/14 18:22, 5年前 , 27F
但妳的資料看起來是panel的,因為跨期有i
11/14 18:22, 27F

11/14 18:22, 5年前 , 28F
d可以串
11/14 18:22, 28F

11/14 18:22, 5年前 , 29F
分三次跑你會忽略個體效果
11/14 18:22, 29F
文章代碼(AID): #1Rw-xh4E (Gossiping)