[問題] 單邊統計推論
統計假說測試,當虛無假說是相等時,對立假說有三種基本型:
不等於、大於、和小於
其中,研究者選擇單邊(大於或小於)的對立假說之心理壓力是,
假說設定必須在進行測試之前就給定,可如果選單邊假說,實際
上測出來是相反的結果,就前功盡棄。
但是稍微再想一下,即使事先指定對立假說是大於,之後測出
來是小於,而且統計顯著,這個結果不是可以闡釋為:
第一、可以合理拋棄虛無假說
第二、其實「真相」是與原先想定相反的小於。
換言之,所謂的︰
要測試新產品(藥品或器材或演算法)與標準品的效能差異時,
因為我們事先不確定新的比較好,所以只保守地使用不等於的對
立假說,以便不管測出哪種結果,我們的統計測試都是「成功的
」。這種主張根本沒道理。畢竟我們的真實目的還是希望得到大
於的測試結果。倘預先給不等於而測試結果是小於,即使我們可
以引用教科書闡釋本測試「成功地」證實應拋棄虛無假說而支持
對立假說,對我們真正想達到的實務目的並無幫助。
事實上,不管我們事先設定哪種對立假說,只要真正測試結果
是大於,那麼這結果的意義才是我們真正想要的:
測試結果證實應拋棄虛無假說且支持大於?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.208.38 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1723409351.A.93B.html
→
08/12 08:32,
1年前
, 1F
08/12 08:32, 1F
→
08/12 08:34,
1年前
, 2F
08/12 08:34, 2F
→
08/12 08:36,
1年前
, 3F
08/12 08:36, 3F
→
08/12 08:38,
1年前
, 4F
08/12 08:38, 4F
→
08/12 08:39,
1年前
, 5F
08/12 08:39, 5F
→
08/12 08:41,
1年前
, 6F
08/12 08:41, 6F
→
08/12 08:42,
1年前
, 7F
08/12 08:42, 7F
→
08/12 08:43,
1年前
, 8F
08/12 08:43, 8F
→
08/12 08:45,
1年前
, 9F
08/12 08:45, 9F
照這個角度看,只要是研究目的要找出更好的產品,給定相等的虛無假說,對立假說
沒得選一定要用大於了。
會有此問是因為閱讀各種領域用到統計的論文,不乏見到:
為了保守起見,本研究對立假說採用雙邊而非單邊大於者
可是研究目的根本明確就是開發新產品。
照上面說法,這類論文根本應該採用單邊大於者。
※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 09:20:59
推
08/12 10:45,
1年前
, 10F
08/12 10:45, 10F
→
08/12 10:45,
1年前
, 11F
08/12 10:45, 11F
如果只是比兩個演算法,看哪個性能好呢?
※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 12:02:54
→
08/12 12:35,
1年前
, 12F
08/12 12:35, 12F
→
08/12 12:56,
1年前
, 13F
08/12 12:56, 13F
→
08/12 12:56,
1年前
, 14F
08/12 12:56, 14F
→
08/12 12:56,
1年前
, 15F
08/12 12:56, 15F
不是很清楚樓上的意思。
假設要測試一個新藥的療效,一個標準方法是和當前標準藥的療效相比。
虛無假說無差別,至於對立假說到底選有差別或大於或小於,並不會影響
測試結果。測試結果顯示新藥療效大於標準藥者,廠商很高興;療效小於
標準藥者,廠商得回去研究如何提升。但這個測試結果和採用何種對立假
說何關?
事先廠商可以選大於或有差別的對立假說,一旦測試假說是小於,這不
滿足對立假說,所以實驗「失敗」。但廠商如果覺得測試新藥有潛力,難
道會因為選了大於的對立假說就不繼續研究改良這個測試新藥?
反之,廠商選了有差別的對立假說,而測試結果是小於,那麼符合對立
假說而實驗「成功」。難道廠商竟可以據此宣稱新藥療效「更好」?
※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 14:15:44
整個想了一下,雖然統計推論的理論有三種對立假說可選,就實際運用
上,只有兩種:
大於 (或小於) <- 視實驗目的而定,目的在證實產品效果優於標準品者
,選擇小於假說乃自始不合邏輯者;反之,目的在證實新產品成本低
於標準品者,選擇大於假說乃自始不合邏輯者。
有差異 <- 即使實驗目的在證實大於(或小於),但是實驗者設計實驗之
時,沒有足夠證據支持本試驗能達成目的,因此本試驗的目的僅限於
和標準品表現有差異就滿足了。倘能達成目的,再進行合於目的之單
邊假說測試;倘不能達成目的,即測試結果無差別者,則基於「本假
說測試設計以外」的證據,決定下一步乃放棄本產品或者做某方面改
良。
這種透過兩個階段來進行假說測試的例子,例如多比較測試。第一
步先做變異數分析,此時對立假說僅是有否差異;倘測試結果顯示有
差異者,再進行後續的一對一或者成對比較測試。
※ 編輯: saltlake (114.36.208.38 臺灣), 08/12/2024 15:25:51
→
08/13 08:43,
1年前
, 16F
08/13 08:43, 16F
→
08/13 08:45,
1年前
, 17F
08/13 08:45, 17F
→
08/13 08:46,
1年前
, 18F
08/13 08:46, 18F
→
08/13 08:48,
1年前
, 19F
08/13 08:48, 19F
→
08/13 08:50,
1年前
, 20F
08/13 08:50, 20F
→
08/13 08:51,
1年前
, 21F
08/13 08:51, 21F
→
08/13 08:52,
1年前
, 22F
08/13 08:52, 22F