Re: [問題] logistic regression

看板Statistics作者yhliu (老怪物)時間18年前 (2007/06/19 00:28)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串3/8 (看更多)

資料數多確實容易顯著, 但殘差卡方值 10873.3, 相對於總 trials 數 44846, 平均每次 trial 貢獻 0.24, 其平方根接近 0.5. 這表示甚麼? 從報表中顯示資料是分成 72 組, 所以 Pearson X^2 是 X^2 = Σn_i Σπ(j|i) (p(j|i)-π(j|i))^2/(π(j|i))^2 i j 其中 n_i 是第 i 組 trials 數, p(j|i) 是第 i 組樣本比例, j=1,2 代表 event/non-event, π(j|i) 代表第 i 組配適結果比例. 因此, √(X^2/n) 大略可以解釋成: 平均相對誤差. 實際上它是均方相對誤差的平方根. 所以, 報表結果顯示配適模型相對誤差達 50%! 這絕不是 "樣本數太大" 能解釋的. 至於模型怎麼改進, 套句曾經流行的對白: 施主! 那要問你啊! 你的反應變數, 用 x1, x2 解釋適當嗎? 夠嗎? x1 與 x2 的效應以 logit scale 來看是相加的嗎? -- 來自統計專業的召喚... 批踢踢實業站 telnet://ptt.cc Statistics (統計學及統計軟體版) 無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區) 成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區) 盈月與繁星 telnet://ms.twbbs.org Statistics (統計：讓數字說話) 交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.15.188.87

‣ 返回看板[ Statistics ] 統計

‣ 更多 yhliu 的文章

文章代碼(AID): #16ThASdb (Statistics)