Re: [問題] 如何把frequency=>probability?

看板Statistics作者 (知其不可奈何而安之若命)時間6年前 (2019/09/18 23:56), 6年前編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/3 (看更多)
: ※ 編輯: coldeye (84.13.81.31 英國), 09/18/2019 08:46:24 : → hsnuyi: 首先 你的n是多少? Chi-squared不一定適合 09/18 15:14 : → hsnuyi: 再者 你只能說兩者的distribution不一樣 母體的狀況跟你當 09/18 15:18 : → hsnuyi: 初抽樣的方式有關 我猜你的n可能不會太大就是了 09/18 15:20 : → hsnuyi: 然後 你Chi-squared是如何執行的? 因為你一直在說機率 你 09/18 15:28 : → hsnuyi: 有group嗎? bias跟var的考量為何? 09/18 15:30 : → hsnuyi: 如果n很小 group的考量就會高度影響rej. H0的機率 09/18 15:34 : → andrew43: 我還是不甚清楚。你要不要編一個明確例子並解一下? 09/18 16:12 : 我的問題是理論層次的思考,而非實際操作。 為了讓問題更清楚,我先舉一般比較熟悉的例子。 假設某盒子中白球的比例為0.1,也可稱作抽到白球的機率為0.1, 我們怎麼「知道」它的比例/機率就是0.1?也就是如何知道它的真實參數? 數學上會說,根據大數法則,當觀測次數趨近無窮大時, 相對頻率會收斂至發生的機率,也就是0.1。 雖然我們做不到無窮大,但我們可以觀測很多次,例如抽100次抽到10顆白球, 這時候就可以用統計估計的方式, 像是直接把相對頻率=機率,或是透過最大概似法MLE來估計背後的真實機率。 透過假設檢定的方式就比較難做到這點, 假設H0: 白球機率=0.1, 我們發現觀測到的相對頻率,在H0下,發生的機會不小, 於是,我們只能說,我們無法拒絕白球機率=0.1。 當我們要進行卡方檢定來檢驗獨立性時, 例如,我們想檢定左右腦側化和左右手優勢是否獨立無關? H0:Pij=Pi.P.j (e.g.右腦型的比例/機率為P1.,左手優勢的比例/機率為P.1, 右腦型左手優勢的比例/機率就是P11) 研究發現 左手優勢 右手優勢 右腦型 12 6 左腦型 17 65 檢定結果發現X^2=15.13 > X()^2=6.635 給定alpha=0.01, 所以拒絕H0,表示腦側化與左右手優勢有關。 此時我們透過檢定,從資料中的「相對頻率」推論到「機率」。 但是,卡方檢定不一定每次都能這樣做。 例如, (學期末) 喜歡英文課 不喜歡 (學期初) 喜歡 9 28 不喜歡 24 19 H0:學期末,學生沒有變得更喜歡英文 (即[喜歡->不喜歡]>=[不喜歡->喜歡]) 檢定發現,H0被拒絕,得到結論為:學期末學生比學期初變得更喜歡英文, 保守可以說,學生喜歡英文的「比例」發生變化, 但我們能說學生喜歡英文的「機率」產生改變嗎? 回到隨機對照試驗, 假設 實驗組(吃藥D) 對照組(不吃藥) 病人數 2416 1195 死亡率 4.2% 6.8% H0:實驗組死亡率>=對照組死亡率 經過卡方檢定,發現拒絕H0,實驗組死亡率明顯低於對照組死亡率。 所以表示該藥D的的確降低了「此試驗」中死亡的「比例」或「相對頻率」, 甚至我們還會說該藥D降低了「一般人」死亡的「機率」。 左右腦和吃藥的兩個例子,我們都可以說機率, 而喜歡英文的例子中,說機率似乎有點怪, 難道是因為前類例子中是在實驗控制中進行, 而後類例子則只是對某一班級的觀測結果? 還是,在統計檢定中,no probability in , no probability out? 意思是在H0和H1時,就要假定真實參數是個未知的固定「機率」值, 此時我們檢定的結果就是機率。 若我們在H0和H1時,假定真實參數是個「比例」或「相對頻率」的話, 此時我們是在檢定比例/相對頻率。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 84.13.77.141 (英國) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1568822209.A.6CB.html ※ 編輯: coldeye (84.13.77.141 英國), 09/18/2019 23:58:52 ※ 編輯: coldeye (84.13.77.141 英國), 09/19/2019 00:02:46
文章代碼(AID): #1TWbF1RB (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1TWbF1RB (Statistics)