[問題] glm跑logistic

看板R_Language作者pk790127 (<>)時間7年前 (2017/04/26 00:58)推噓5(5推 0噓 25→)

留言30則, 5人參與討論串1/1

[問題類型]: 程式諮詢(我想用R 做某件事情，但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式，只是對語法不熟悉) [問題敘述]:當我使用glm套件中邏輯式迴歸(y為二元變數"binomial")時 modle <-glm(model1, family = "binomial" ,data = train ) 跑出警告訊息 Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically 0 or 1 occurred 上網搜尋了一下解法... 得出 https://goo.gl/aNHEtU 1.用 bayesglm 在arm這個套件 modle <-bayesglm(model1, family = "binomial" ,data = train ) 2.用 glmnet套件 modle1 <-glmnet(x=as.matrix(train[,-c(1,26)]) ,y=train[,1] ,family = "binomial" ) 兩個作法都可以跑,也可以預測,但是想知道原先glm的錯誤原因是什麼 train跟test資料應該都沒問題 y是二元的數值型態 x有連續也有二元都是數值型態另外在glmnet預測中 s這個值不填的話欄位很奇怪,看解釋是指懲罰參數,但我原先的 logistic沒有lamba參數阿.. glm_result <-predict(modle1, s=0.01, as.matrix(test[, -c(1,26)]), type="response") 這些問題可能是我方法論不熟悉,但請有使用過這些套件的前輩們提點一下謝謝~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.86.113 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1493139483.A.5BF.html

→

pk790127

04/26 00:59, , 1^F

04/26 00:59, 1^F

→

pk790127

04/26 00:59, , 2^F

04/26 00:59, 2^F

→

andrew43

04/26 01:49, , 3^F

04/26 01:49, 3^F

→

andrew43

04/26 01:50, , 4^F

04/26 01:50, 4^F

→

andrew43

04/26 01:52, , 5^F

04/26 01:52, 5^F

→

pk790127

04/26 02:22, , 6^F

04/26 02:22, 6^F

→

pk790127

04/26 02:22, , 7^F

04/26 02:22, 7^F

※ 編輯: pk790127 (61.227.242.178), 04/26/2017 02:35:04

→

andrew43

04/26 11:38, , 8^F

04/26 11:38, 8^F

→

andrew43

04/26 11:39, , 9^F

04/26 11:39, 9^F

謝謝~ 我知道glmnet是lasso的套件,所以我把lambda設為0當作一般2元迴歸使用另外我也有去看舊文所提到的高相關,我做了VIF確定有沒有共線性(均<10) 總結來說如果互略那個warning做的glm預測率是95%;另外使用glmnet(lambda=0)預測率也是95%... 至於那個bayesglm我只知道是事後機率的概念...可能還要研究一下 ※ 編輯: pk790127 (140.116.86.113), 04/26/2017 13:21:03

→

clansoda

04/26 16:37, , 10^F

04/26 16:37, 10^F

→

pk790127

04/26 17:32, , 11^F

04/26 17:32, 11^F

→

pk790127

04/26 17:32, , 12^F

04/26 17:32, 12^F