[問題] 關於stata,multinomial logit,找PredictP

看板Statistics作者 (陳思毛)時間12年前 (2014/03/14 14:12), 編輯推噓5(5024)
留言29則, 2人參與, 最新討論串1/1
又來請教板上的大家了QQ 想問當我利用stata進行mlogit後 想要得到Predict Probability的問題 第一個是outcome A的整理 . tab A A | Freq. Percent Cum. ------------+----------------------------------- 1 | 501 62.78 62.78 2 | 245 30.70 93.48 3 | 52 6.52 100.00 ------------+----------------------------------- Total | 798 100.00 而當我跑完molgit之後 依照stata手冊上所說想得到估計的機率 . predict P1 P2 P3 (option pr assumed; predicted probabilities) . summarize P1 P2 P3 Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- P1 | 798 .6278195 .0961358 .2042496 .8797781 P2 | 798 .3070176 .1041065 .0910776 .7751256 P3 | 798 .0651629 .017927 .0193713 .1271836 得到的各個比例卻跟實際樣本的比例(tab中)一樣 62.78 vs 0.6278195 30.70 vs 0.3070176 6.52 vs 0.0651629 想問說這個predict是代表說把樣本再放到跑完mlogit之後的估計式中得到的嗎? 而當我計算margin effects時也會得到一個predict possibility感覺比較像要求的 . mfx, predict (outcome(1)) Marginal effects after mlogit y = Pr(A==1) (predict, outcome(1)) = .63693578 ------------------------------------------------------------------------------ variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------- CE | .005055 .00159 3.18 0.001 .001939 .008171 49.4875 CG | .0121339 .00584 2.08 0.038 .000685 .023583 12.896 CJ | .0004675 .00027 1.73 0.083 -.000062 .000997 95.5702 ------------------------------------------------------------------------------ 表裡面的 y = Pr(A==1) (predict, outcome(1)) 感覺比較像我得到的 = .63693578 不知道用margin effect所做的是否正確 然後如果想得到估計的機率要怎麼求得呢 想確定一下兩種方式估計出來的機率是代表甚麼意思 再次感謝大家QQ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.86.49 ※ 編輯: myjstyle 來自: 140.112.86.49 (03/14 14:13)

03/14 14:31, , 1F
第一個不是基本要求嗎.....
03/14 14:31, 1F

03/14 14:33, , 2F
想問就是predict P1 P2 P3的指令的部分和mfx, predict
03/14 14:33, 2F

03/14 14:33, , 3F
第一個表格是想說可以讓大家對照
03/14 14:33, 3F

03/14 14:34, , 4F
因為用predict P1 P2 P3跑出來的結我跟實際樣本比例一樣
03/14 14:34, 4F

03/14 14:34, , 5F
覺得好像怪怪的
03/14 14:34, 5F
※ 編輯: myjstyle 來自: 140.112.86.49 (03/14 14:34)

03/14 14:38, , 6F
為什麼怪怪的?
03/14 14:38, 6F

03/14 14:39, , 7F
覺得估計出來的東西跟實際的比例完全一樣
03/14 14:39, 7F

03/14 14:39, , 8F
感覺有哪裡出錯
03/14 14:39, 8F

03/14 14:39, , 9F
或是他算的東西是計算別的
03/14 14:39, 9F

03/14 14:40, , 10F
就是我想利用mlogit得到不同樣本得到某種類別(outcome)
03/14 14:40, 10F

03/14 14:41, , 11F
估計的機率
03/14 14:41, 11F

03/14 14:41, , 12F
想說如果預測的機率跟實際的機率一樣
03/14 14:41, 12F

03/14 14:42, , 13F
那這樣的話不是就直接算那個類別的比例就好了?
03/14 14:42, 13F

03/14 14:42, , 14F
predict指令就是作這件事情啊。 難道跑一個回歸模型的時候
03/14 14:42, 14F

03/14 14:42, , 15F
你會期待mean(hat(y))跟mean(y)不一樣嗎?
03/14 14:42, 15F

03/14 14:43, , 16F
跑迴歸就是要用到X的資訊,直接算類別比例只有Y的。
03/14 14:43, 16F

03/14 14:44, , 17F
預測出來的比例要跟實際比例相同是基本要求,但不保證在模
03/14 14:44, 17F

03/14 14:44, , 18F
模型下分到A的樣本跟在實際資料中分到A的樣本一模一樣。
03/14 14:44, 18F

03/14 14:49, , 19F
這部分懂了>< 感謝YukirinQQ
03/14 14:49, 19F

03/14 14:49, , 20F
想問mfx, predicte (outcome(1))
03/14 14:49, 20F

03/14 14:50, , 21F
mfx主要的用處是你可以試算說給定x1=??? x2=???時候的機率
03/14 14:50, 21F

03/14 14:51, , 22F
算出來的機率的話代表的是甚麼,換這邊不太懂了
03/14 14:51, 22F

03/14 14:51, , 23F
所以我猜你在沒有指定那些值的情況下,他給了你一個
03/14 14:51, 23F

03/14 14:51, , 24F
given x1=mean(x1) x2=mean(x2)下outcome==1的機率
03/14 14:51, 24F

03/14 14:51, , 25F
喔喔我想一下!!! 感謝你><
03/14 14:51, 25F

03/14 14:52, , 26F
好像瞭解了!!所以如果我想了解其中一個樣本的機率
03/14 14:52, 26F

03/14 14:53, , 27F
就是把變數帶進去得到的就是了
03/14 14:53, 27F

03/14 14:54, , 28F
不用,其中一個樣本的機率你已經用predict得到了
03/14 14:54, 28F

03/14 15:00, , 29F
了解了!!!非常感謝Yukirin QQ 謝謝你><!!!
03/14 15:00, 29F
文章代碼(AID): #1J8ftTe0 (Statistics)