[問題] 單邊統計推論

看板Statistics作者saltlake (SaltLake)時間1年前 (2024/08/12 04:49)推噓1(1推 0噓 21→)

留言22則, 2人參與討論串1/1

統計假說測試，當虛無假說是相等時，對立假說有三種基本型: 不等於、大於、和小於其中，研究者選擇單邊(大於或小於)的對立假說之心理壓力是，假說設定必須在進行測試之前就給定，可如果選單邊假說，實際上測出來是相反的結果，就前功盡棄。但是稍微再想一下，即使事先指定對立假說是大於，之後測出來是小於，而且統計顯著，這個結果不是可以闡釋為: 第一、可以合理拋棄虛無假說第二、其實「真相」是與原先想定相反的小於。換言之，所謂的︰要測試新產品(藥品或器材或演算法)與標準品的效能差異時，因為我們事先不確定新的比較好，所以只保守地使用不等於的對立假說，以便不管測出哪種結果，我們的統計測試都是「成功的」。這種主張根本沒道理。畢竟我們的真實目的還是希望得到大於的測試結果。倘預先給不等於而測試結果是小於，即使我們可以引用教科書闡釋本測試「成功地」證實應拋棄虛無假說而支持對立假說，對我們真正想達到的實務目的並無幫助。事實上，不管我們事先設定哪種對立假說，只要真正測試結果是大於，那麼這結果的意義才是我們真正想要的: 測試結果證實應拋棄虛無假說且支持大於? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.208.38 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1723409351.A.93B.html

→

08/12 08:32, 1年前 , 1^F

08/12 08:32, 1^F

→

08/12 08:34, 1年前 , 2^F

08/12 08:34, 2^F

→

08/12 08:36, 1年前 , 3^F

08/12 08:36, 3^F

→

08/12 08:38, 1年前 , 4^F

08/12 08:38, 4^F

→

08/12 08:39, 1年前 , 5^F

08/12 08:39, 5^F

→

08/12 08:41, 1年前 , 6^F

08/12 08:41, 6^F

→

08/12 08:42, 1年前 , 7^F

08/12 08:42, 7^F

→

08/12 08:43, 1年前 , 8^F

08/12 08:43, 8^F

→

08/12 08:45, 1年前 , 9^F

08/12 08:45, 9^F

照這個角度看，只要是研究目的要找出更好的產品，給定相等的虛無假說，對立假說沒得選一定要用大於了。會有此問是因為閱讀各種領域用到統計的論文，不乏見到: 為了保守起見，本研究對立假說採用雙邊而非單邊大於者可是研究目的根本明確就是開發新產品。照上面說法，這類論文根本應該採用單邊大於者。 ※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 09:20:59

推

08/12 10:45, 1年前 , 10^F

08/12 10:45, 10^F

→

08/12 10:45, 1年前 , 11^F

08/12 10:45, 11^F

如果只是比兩個演算法，看哪個性能好呢? ※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 12:02:54

→

08/12 12:35, 1年前 , 12^F

08/12 12:35, 12^F

→

08/12 12:56, 1年前 , 13^F

08/12 12:56, 13^F

→

08/12 12:56, 1年前 , 14^F

08/12 12:56, 14^F

→

08/12 12:56, 1年前 , 15^F

08/12 12:56, 15^F

不是很清楚樓上的意思。假設要測試一個新藥的療效，一個標準方法是和當前標準藥的療效相比。虛無假說無差別，至於對立假說到底選有差別或大於或小於，並不會影響測試結果。測試結果顯示新藥療效大於標準藥者，廠商很高興；療效小於標準藥者，廠商得回去研究如何提升。但這個測試結果和採用何種對立假說何關? 事先廠商可以選大於或有差別的對立假說，一旦測試假說是小於，這不滿足對立假說，所以實驗「失敗」。但廠商如果覺得測試新藥有潛力，難道會因為選了大於的對立假說就不繼續研究改良這個測試新藥? 反之，廠商選了有差別的對立假說，而測試結果是小於，那麼符合對立假說而實驗「成功」。難道廠商竟可以據此宣稱新藥療效「更好」? ※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 14:15:44 整個想了一下，雖然統計推論的理論有三種對立假說可選，就實際運用上，只有兩種: 大於 (或小於) <- 視實驗目的而定，目的在證實產品效果優於標準品者，選擇小於假說乃自始不合邏輯者；反之，目的在證實新產品成本低於標準品者，選擇大於假說乃自始不合邏輯者。有差異 <- 即使實驗目的在證實大於(或小於)，但是實驗者設計實驗之時，沒有足夠證據支持本試驗能達成目的，因此本試驗的目的僅限於和標準品表現有差異就滿足了。倘能達成目的，再進行合於目的之單邊假說測試；倘不能達成目的，即測試結果無差別者，則基於「本假說測試設計以外」的證據，決定下一步乃放棄本產品或者做某方面改良。這種透過兩個階段來進行假說測試的例子，例如多比較測試。第一步先做變異數分析，此時對立假說僅是有否差異；倘測試結果顯示有差異者，再進行後續的一對一或者成對比較測試。 ※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 15:25:51

→

08/13 08:43, 1年前 , 16^F

08/13 08:43, 16^F

→

08/13 08:45, 1年前 , 17^F

08/13 08:45, 17^F

→

08/13 08:46, 1年前 , 18^F

08/13 08:46, 18^F

→

08/13 08:48, 1年前 , 19^F

08/13 08:48, 19^F

→

08/13 08:50, 1年前 , 20^F

08/13 08:50, 20^F

→

08/13 08:51, 1年前 , 21^F

08/13 08:51, 21^F

→

08/13 08:52, 1年前 , 22^F

08/13 08:52, 22^F

‣ 返回看板[ Statistics ] 統計

‣ 更多 saltlake 的文章

文章代碼(AID): #1ckIF7ax (Statistics)