[問題] 關於poisson regression medel的建立以及檢定

看板Statistics作者 (傀儡:影武者)時間15年前 (2011/03/26 18:04), 編輯推噓0(0027)
留言27則, 4人參與, 最新討論串1/1
想要研究某種疾病在不同地區以及不同年齡層的發生率是否有差異 假設 分成南區和北區 年齡分三組(<35, 35~74, >75) 每個地區每個年齡層的疾病發生率也收集好了 (總共有6筆資料:住在南區且年齡<35的發 生率, 住在南區且年齡35~74的發生率, ....依此類推) 現在想要建立poisson regression model 我的想法是先單獨看某年齡層,然後建立該年齡層的model如下 λ(發生率) = exp (β0 + β1X) (北區X=1, 南區X=0) 而因為有三個年齡層所以會有三個model 現在問題來了 1. 要先檢定模型適合度,跟據我現在只擁有6筆資料,要怎麼檢定? 2. 假設檢定結果是適合的,要如何檢定年齡、地區對於發生率是否有影響,可不可以說 一下基本原理 謝謝 http://www2.cmu.edu.tw/~biostat/online/teaching_corner_050-2.pdf 上面是使我產生困惑的文章 裡面只有說用SAS這種軟體分析 我想知道詳細方法 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 120.126.71.150

03/26 18:23, , 1F
為什麼要分成三個model?
03/26 18:23, 1F

03/26 18:31, , 2F
所以只要加上B2X 然後X=0, 1, 2 分別代表年齡 就好了嗎?
03/26 18:31, 2F

03/26 18:31, , 3F
至於基本原理,你可以查google,看看英文的網頁。非常多
03/26 18:31, 3F

03/26 18:33, , 4F
那篇文章裡不是交待得很清楚嗎?其實我不懂你的問題是什麼
03/26 18:33, 4F

03/26 18:35, , 5F
我不懂位什麼這個時候要用poisson而不用logistic
03/26 18:35, 5F

03/26 18:37, , 6F
還有就是beta0 1 2求出來後如何幫助判斷是否有差異
03/26 18:37, 6F

03/26 18:38, , 7F
是只要非0就有差異嗎 還是有什麼檢定方法
03/26 18:38, 7F

03/26 18:54, , 8F
嗯。用logistic的話,還要知道多少人沒病。這點差很多。
03/26 18:54, 8F

03/26 21:04, , 9F
如果只有 "發生率", 基本上你能做的不是 Poisson model.
03/26 21:04, 9F

03/26 21:04, , 10F
Poisson regression model 用的資料是 "發生數".
03/26 21:04, 10F

03/26 21:05, , 11F
另外, 事實上可以說沒辦法檢查 Poisson model 是否合適.
03/26 21:05, 11F

03/26 21:07, , 12F
事實上用 rate 建模是對的, 但只有 rate 是不夠的.
03/26 21:07, 12F

03/26 21:07, , 13F
而 model 很簡單, ln(rate) = GM + Region + Age
03/26 21:07, 13F

03/26 21:08, , 14F
或 ln(rate) = GM + Region + Age + Region*Age
03/26 21:08, 14F

03/26 21:09, , 15F
Region 已是 0-1 變數, Age 考慮用兩個 dummy 或給予代表值.
03/26 21:09, 15F

03/26 21:10, , 16F
若 Age 用兩個 dummy variable 表現, 則
03/26 21:10, 16F

03/26 21:10, , 17F
有 Region*Age 的 model 是飽和模型, 沒有殘差.
03/26 21:10, 17F

03/26 21:59, , 18F
謝謝樓上 請問模型建立後 要檢定年齡或地區是否造成顯著
03/26 21:59, 18F

03/26 22:00, , 19F
是不是要看該變項之exp(係數) 是否等於1
03/26 22:00, 19F

03/26 22:01, , 20F
如果是的話 那麼exp(係數)之信賴區間要怎麼算
03/26 22:01, 20F

03/26 23:52, , 21F
如果你只有 rate, 基於各 rate 的誤差不等, 我無可建議.
03/26 23:52, 21F

03/26 23:53, , 22F
如果你有算出 rate 的人口基數, 用 Poisson regression 的
03/26 23:53, 22F

03/26 23:54, , 23F
rate model, 請參閱 "類別資料分析" 或 "廣義線模" 或
03/26 23:54, 23F

03/26 23:55, , 24F
"Poisson regression model" 的專書.
03/26 23:55, 24F

03/28 09:29, , 25F
先列出地區和年齡的列聯表
03/28 09:29, 25F

03/28 09:30, , 26F
把六筆資料用兩個變項去coding 再去跑SAS的genmod
03/28 09:30, 26F

03/28 09:32, , 27F
人口用的發生率 是給定人口有一個單位 在計算上作為offset
03/28 09:32, 27F
文章代碼(AID): #1DZReUpC (Statistics)