[問題] 不同複合假說對相同多重測試的解釋

看板Statistics作者saltlake (SaltLake)時間1年前 (2024/11/17 14:07)推噓2(2推 0噓 25→)

留言27則, 2人參與討論串1/1

To demonstrate that the new algorithm A is superior to the old algorithms B, C, and D, three comparison tests were performed. The results showed that A>B (p=0.009), A>C (p=0.002), and A>D (p=0.04). The overall significance level was 0.03. The multiplicity was corrected using the Bonferroni method. How does one interprete the results if the following tests were performed, respectively: (1) union-intersection test, (2) intersection-union test, and (3) intersection-intersection test? 根據上述多重測試的設定，整體顯著水準是 0.03/3 = 0.01。所以三個個別測試的顯著與否如下: A>B (p=0.009), 顯著 A>C (p=0.002), 顯著 and A>D (p=0.04), 不顯著單看上述測試結果，其解釋似乎是: 演算法 A 只比 B 和 C 好，但是無法判定其是否比 D 好--能說不比 D 差嗎? 還是只要不顯著就啥也不能宣稱? 問題是，完整的多重假說測試應該要考慮整體假說的不同(內容)類型去詮釋測試結果(?) 那麼在上述三種不同類型的整體假說下，怎樣個別詮釋上面所得的測試結果? (一) 聯交集測試整體零假說和代假說分別為不大於的交集和大於的聯集，因而要拒卻整體零假說需要滿足至少有一個個別測試是統計顯著的大於。上述測試結果滿足此要求，故可拒卻整體零假說而接受代假說，從而應解釋為: 測試結果證實新算法至少大於一個老算法。 (二) 交聯集測試: 整體零假說和代假說分別為不大於的聯集和大於的交集，因而要拒卻整體零假說需要滿足所有的個別測試都是統計顯著的大於。顯然測試結果不合要求，故不可拒卻整體零假說而接受代假說，從而應解釋為: 測試無法推翻(或否證)新算法至少不大於一個老算法…嗎? (三) 交交集測試: 整體零假說和代假說分別為不大於的交集和大於的交集，因而要拒卻整體零假說需要滿足所有的個別測試都是統計顯著的大於。顯然測試結果不合要求，故不可拒卻整體零假說而接受代假說，從而應解釋為: 測試結果無法推翻(或否證)新算法全都不大於那三個老算法…嗎? (四) 是否能夠或如何設計整體零假說與代假說，使其測試結果能得到和個別測試的結果相同的解釋? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.207.45 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1731823628.A.8CC.html ※ 編輯: saltlake (114.36.207.45 臺灣), 11/17/2024 21:08:37 ※ 編輯: saltlake (114.36.207.45 臺灣), 11/17/2024 21:11:16

推

jasonfun44

11/28 07:17, 1年前 , 1^F

11/28 07:17, 1^F

→