Re: [問題] logistic regression
資料數多確實容易顯著, 但殘差卡方值 10873.3, 相對於
總 trials 數 44846, 平均每次 trial 貢獻 0.24, 其平
方根接近 0.5. 這表示甚麼?
從報表中顯示資料是分成 72 組, 所以 Pearson X^2 是
X^2 = Σn_i Σπ(j|i) (p(j|i)-π(j|i))^2/(π(j|i))^2
i j
其中 n_i 是第 i 組 trials 數, p(j|i) 是第 i 組樣本
比例, j=1,2 代表 event/non-event, π(j|i) 代表第 i
組配適結果比例.
因此, √(X^2/n) 大略可以解釋成: 平均相對誤差. 實際
上它是均方相對誤差的平方根.
所以, 報表結果顯示配適模型相對誤差達 50%! 這絕不是
"樣本數太大" 能解釋的.
至於模型怎麼改進, 套句曾經流行的對白:
施主! 那要問你啊!
你的反應變數, 用 x1, x2 解釋適當嗎? 夠嗎? x1 與 x2
的效應以 logit scale 來看是相加的嗎?
--
來自統計專業的召喚...
批踢踢實業站 telnet://ptt.cc Statistics (統計學及統計軟體版)
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.15.188.87
討論串 (同標題文章)
完整討論串 (本文為第 3 之 8 篇):