[問題] 如果比較模型是否合適?

看板Statistics作者 (巴克球)時間10年前 (2015/11/26 16:08), 10年前編輯推噓0(0032)
留言32則, 6人參與, 最新討論串1/1
今天一筆資料 我們去作線性模型和 廣義線性模型 要如何比較那個模型較好? 再者殘差分析在廣義線模有用嗎? R^2外 有其他看配適是否優劣的方法嗎? 請各位大大賜教~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.8.85.58 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1448525327.A.ED8.html

11/26 22:09, , 1F
廣義線性模型是指?
11/26 22:09, 1F

11/26 23:44, , 2F
Glm吧?
11/26 23:44, 2F
恩 是GLM的意思 有比較兩者優劣的方法嗎? >"< ※ 編輯: jackhzt (39.8.85.58), 11/26/2015 23:52:26

11/27 00:02, , 3F
AIC, BIC, SBC,...etc 應該…可用
11/27 00:02, 3F

11/27 02:32, , 4F
我知道是GLM 我只是想問詳細一點的model長怎麼樣
11/27 02:32, 4F

11/27 02:33, , 5F
一定有些criterion可以比較不同的模型 但為什麼需要用
11/27 02:33, 5F

11/27 02:34, , 6F
GLM 一定有其原因 我只是希望原po多想一下這個 而不是
11/27 02:34, 6F

11/27 02:34, , 7F
直接fit兩個模型 來比較 這個比較好就用這個 這樣
11/27 02:34, 7F

11/27 02:35, , 8F
GLM可以有幾百種
11/27 02:35, 8F

11/27 02:44, , 9F
每個模型都有其假設 先想一下這些假設
11/27 02:44, 9F
如果有一筆資料 它是poisson的樣子 但是今天我故意忽略這個事實 而強用線性迴歸去配 適它 且線性的R^2有0.8多 而改用GLM的poisson 迴歸再做一次 發現是比較好的 那我該 用那些理由來說明它(poisson reg.)的配適比較好 ※ 編輯: jackhzt (110.26.146.23), 11/27/2015 03:20:30

11/27 03:29, , 10F
如果資料真的適合poisson且次數不多(即y值不大)那可能
11/27 03:29, 10F

11/27 03:30, , 11F
用poisson較佳。
11/27 03:30, 11F

11/27 03:30, , 12F
建議你看看y本身分配的偏度大不大。
11/27 03:30, 12F

11/27 04:04, , 13F
如果你最後的目的是預測 那麼線性迴歸的預測值合理嗎
11/27 04:04, 13F

11/27 10:09, , 14F
先看random error的distribution 如果normal 可用一般
11/27 10:09, 14F

11/27 10:09, , 15F
迴歸 如果不normal 就看看是否符合其他exponential fam
11/27 10:09, 15F

11/27 10:09, , 16F
ily 這時候用glm
11/27 10:09, 16F
謝謝大大們的說明 那有沒有除了主觀判斷外 比較有明確準則的檢定 對於一個linear vs GLM? ※ 編輯: jackhzt (110.26.146.23), 11/27/2015 11:55:19

11/27 12:05, , 17F
AIC應該是最簡單的吧
11/27 12:05, 17F

11/27 12:05, , 18F
poisson還要check over-dispersion的部分
11/27 12:05, 18F

11/27 12:06, , 19F
不過還是建議透過了解資料跟模型的假設建模比較恰當
11/27 12:06, 19F

11/27 12:07, , 20F
不應該只是透過criterion去決定模型
11/27 12:07, 20F
這邊想再詢問一下 對於AIC我的理解是 選擇是否要選取此參數 加入模型來討論 如果光比較AIC是洽當的嗎?(上次因為這問題在臺上罰站許久 =口=) ※ 編輯: jackhzt (110.30.129.26), 11/27/2015 15:45:03

11/27 16:39, , 21F
沒有一個準則可以適用於比較任意兩種模型
11/27 16:39, 21F

11/27 16:40, , 22F
真的不建議你單純說用AIC 你應該要去了解 每個準則
11/27 16:40, 22F

11/27 16:40, , 23F
重視的地方在哪裡 優缺點在哪裡 差異在那裡
11/27 16:40, 23F

11/27 16:41, , 24F
在台上罰站許久 應該是來自於 你對於這些準則的不了解
11/27 16:41, 24F

11/27 16:41, , 25F
卻用它來做結論
11/27 16:41, 25F

11/27 16:42, , 26F
不同的準則 常常會給出不一樣的答案
11/27 16:42, 26F

11/27 17:09, , 27F
請問你fit這模型用意是什麼呢
11/27 17:09, 27F

11/27 19:18, , 28F
我後來稍微查一下,不同link functions是不能比較AI
11/27 19:18, 28F
celestialgod: C的,目前比較可行的方法應該是用MSE 11/27 19:18 謝謝大家的指教 這模型主要是預測未來的趨勢 再比較誰比較準 剛剛看了蠻多資料的 會試試看Mse或其它方式 CV也許也是好選擇 關於aic也在看它的資 料中 謝謝大大們~ ※ 編輯: jackhzt (110.30.129.26), 11/28/2015 00:37:19

11/28 15:35, , 29F
你應該要看你所重視的點是什麼(例:效率性、準確性…等)
11/28 15:35, 29F

11/28 15:35, , 30F
比較才有意義
11/28 15:35, 30F

11/28 15:36, , 31F
單就模型來說 沒有哪一種是一定比另一種來得好或壞
11/28 15:36, 31F

11/28 15:37, , 32F
要看使用者的目的跟資料特性的配適
11/28 15:37, 32F
文章代碼(AID): #1MLhuFxO (Statistics)