作者查詢 / yhliu
作者 yhliu 在 PTT [ Statistics ] 看板的留言(推文), 共7582則
限定看板:Statistics
看板排序:
1F→: 教本應該有公式啊?有限群體不放還法簡單隨機抽樣:03/07 06:45
2F→: E[樣本平均] = 群體平均;03/07 06:46
3F→: V(樣本平均) = (群體變異數)/n * (N-n)/(N-1)03/07 06:47
4F→: 上列群體變異數是以 N(群體大小) 為除數03/07 06:49
5F→: E[樣本變異數] = (群體變異數) * N/(N-1)03/07 06:50
6F→: 上列樣本變異數是以 n-1 (n為樣本大小) 為除數03/07 06:52
7F→: 若計算群體變異數是以 N-1 為除數,E[s^2] = 群體變異數03/07 06:54
1F→: X 對 Y 有顯著影響,X 與 Y 之間有顯著相關,Y 在不同 X 水02/27 07:52
2F→: 準之間有顯著差異等等描述法其意義大致類似。02/27 07:54
4F→: 例如說性別對於學習成效是否有顯著相關,02/28 07:09
5F→: 也可以說性別對學習成效影響是否顥著,02/28 07:11
6F→: 或者說不同性別的學習成效差異是否顯著。02/28 07:13
14F→: 如果檢定結論是男女性學習成效有差異,為什麼不能說性別和03/02 08:30
15F→: 學習成效有相關?如果年齡和學習成效有相關,為什麼不能說03/02 08:33
16F→: 不同年齡層的學習成效有差異?有什麼道理說談差異只能用 t03/02 08:35
17F→: 檢定,ANOVA 的方法談?有什麼理由說談兩變數相關或關聯只03/02 08:37
18F→: 能檢定相關係數?簡單直線迴歸係數的 t 檢定也可用於檢定依03/02 08:39
19F→: 變數和自變數是否存在直線相關;ANOVA 可以用於檢定反應變03/02 08:40
20F→: 數與離散化解釋變數間是否存在直線或曲線相關。列聯表卡方03/02 08:43
21F→: 檢定既是檢定列變數與行變數是否存在相關(關聯),也是檢定03/02 08:44
22F→: 各行或各列的(條件)分布是否一致(即:是否有差異)。03/02 08:46
1F→: 把一個樣本分割成訓練樣本和確認樣本做交互確認,本來就是01/22 08:10
2F→: 確認模型的簡略方式。如果在模型建立配適好之後再另尋現實01/22 08:13
3F→: 樣本資料做確認,更符合交互確認的本意。01/22 08:15
2F→: 沒錯,單只因不同測量是在同一個體做的,就要考慮它們之間01/22 08:02
3F→: 可能存在相關;而不同測量之間另有共同或相反特徵,更使得01/22 08:04
4F→: 其暑存在複雜關聯,這些複雜關聯或許會導致如相關係數之類01/22 08:06
5F→: 的關聯指標隱而不顯,但卻不會使這些測量結果相互獨立。01/22 08:08
1F→: 必須時時刻刻記得它們存在著相關性。01/21 08:23
12F→: 題又考慮到假說群子集的問題,所以有Duncan, Holm 等修正01/04 08:18
14F→: 不考慮子集問題。01/04 08:21
13F→: Tukey 和 Bonferroni 法的程序。而在 UI 和 IU 檢定中,並01/04 08:19
1F→: https://yhliu2k.pixnet.net/blog/post/17031618401/01 10:02
2F推: https://pages.stat.wisc.edu/~shao/stat610/stat610-13.pd01/02 07:19
3F→: 上面連結網址最後是 .pdf01/02 07:21
4F→: 我看不懂你把這些假說和檢定看成什麼?在我的眼中,多重檢01/04 07:58
5F→: 定重點在各子假說檢定之外同時希望兼顧總體型一錯誤機率,01/04 08:00
6F→: 相當於在各子檢定之外又考慮了UI檢定,不過卻不一定用UI檢01/04 08:03
7F→: 定的方法。至於UI檢定和IU檢定的虛無假說本就不同,如何能01/04 08:04
8F→: 期望有 "一致" 的結果?01/04 08:05
9F→: UI檢定算是多重檢定中控制FWER的一個簡單檢定規則,但其實01/04 08:07
10F→: 它的檢定大小不易計算;ANOVA中的 Scheffe法和Tukey法多重01/04 08:12
11F→: 比較則是在正確檢定大小的UI假說的檢定方法。但多重檢定問01/04 08:14
22F→: 一群評價者主觀評估演算法優劣,而以統計假說檢定判定各演01/05 10:30
17F→: 真要比較演算法優劣當然可以訂定適當標準做客觀評估,這是01/05 10:18
20F→: 但不是用演算法性質的數學分析而是採用實驗方式以獲取各演01/05 10:25
19F→: 計方法可使用統計假說檢定做評估,其一也是先擇定評估準則,01/05 10:24
18F→: 非統計方法。但是,涉及演算法比較至少還有兩種情形涉及統01/05 10:22
24F→: 前說重點不在演算法而是統計假說檢定,因 "演算法比較" 只01/05 10:35
21F→: 算法實證數據相互比較,這也是一種客觀比較。其次,可以由01/05 10:27
27F→: 方法和思路?01/05 10:40
23F→: 法在潛在使用者或評價者心目中的優劣。不過,就本問,我先01/05 10:33
25F→: 是問題隨意敘述的一個例子,就像數學練習中很多例子,難道01/05 10:37
26F→: 重點在那些看起來毫無實用價值的 "實例" 而不是涉及的數學01/05 10:39
2F→: 重點不是 "演算法", 而是統計假說檢定. 不過, 我所學太淺,12/13 09:30
3F→: 沒學過 intersection-intersection test.12/13 09:31
4F→: 如果個別檢定顯著水準都是 0.01 的話, UI檢定會拒絕聯合的12/13 09:33
5F→: 虛無假說, 意謂 A>B, A>C, A>D 並非全部成立;12/13 09:34
6F→: IU檢定不拒絕虛無假說,意謂 A>B,A>C,A>D 至少一個成立.12/13 09:36
7F→: 上面錯了...UI test 的結果是 A>B or A>C or A>D 不被接受12/13 09:39
8F→: 唉! 又弄錯了, H0i 應是 A<=B, A<=C, A<=D, UI test 的結果12/13 09:42
9F→: 是三個虛無假說並非全部成立, 所以 A>B or A>C or A>D 至少12/13 09:43
10F→: 一個成立; 而 IU test 的結果是 A>B, A>C, A>D 並非全部成12/13 09:44
11F→: 立, 因為 A<=B, A<=C, A<=D 至少一個成立.12/13 09:45
12F→: 根據顯著水準0.01做個別檢定建構的 UIT 符合顯著水準0.03,12/14 15:53
13F→: 而IUT的顯著水準是0.01.12/14 15:54
14F→: "A>D 不顯著" 就是不能拒絕 "A<=D" 這個虛無假說。12/17 07:56
1F→: 想一想如果在第一步就不顥著,是不是依控制整體型一誤機率09/29 08:03
2F→: 的原理,所有虛無假說都應判定不顥著?也就是說:只有在控09/29 08:04
3F→: 制了整體型一誤機率之下判定目前這個假說是顯著的,才有必09/29 08:07
4F→: 要再檢查,或說有可能仍存在其他顯著的虛無假說。09/29 08:08
5F→: https://yhliu2k.pixnet.net/blog/post/16343260609/29 11:25
1F→: PFER = E[V], 假陽性數期望值, = m*PCER09/08 11:17
6F→: 統計假說檢定是關於群體參數的二元分割的判斷,虛無假說是09/01 10:12
7F→: 傾向於保守的一種揣測,對立假說是想要由資料獲得支持證據09/01 10:15
8F→: 的另一個猜測。例如在藥學統計,一種新藥的提出,需要證據09/01 10:17
9F→: 說新藥比舊藥好,H0 說新藥沒有比較好,Ha 說新藥比較好。09/01 10:19
10F→: p 值是依現有資料,H0 能被拒絕,也就是 Ha 被支持的最小顯09/01 10:21
11F→: 著水準。在 p 值未流行以前,是固定顯著水準,而檢定結果說09/01 10:22
12F→: 拒絕 H0 (支持 Ha) 或不拒絕 H0,也就是所謂的顯著或不顯著09/01 10:24
13F→: 所以 p 值比固定水準的顯著不顯著好,因為比如報告者用 .0509/01 10:26
14F→: 顯著水準說顯著,但閱讀或聆聽報告者卻覺得 .05 的容許型一09/01 10:28
15F→: 誤機率水準太寬鬆或太嚴格,則無法做自己的顯著不顯著判定09/01 10:30
16F→: 而有了 p 值就沒這樣的遺憾了。但無論報告顯著與否或 p 值,09/01 10:32
17F→: 如前面新藥是否較好的例子,也只能知道在給定之顥著水準下,09/01 10:34
18F→: 是否能支持 "新藥較好" 這樣的揣測,卻無法告訴我們:新舊09/01 10:36
19F→: 藥的差距是大還是小,要知道這個,就要看樣本估計出的差異09/01 10:39
20F→: 例如治癒率的差距,恢復程度指標差異等。但關於這些差距,09/01 10:41
21F→: 我們希望知道的是群體的情形,而我們實際只能看到樣本的估09/01 10:43
22F→: 計結果,於是將抽樣誤差考慮進去,有信賴區間或區間估計的09/01 10:45
23F→: 概念,說在某百分比的信賴水準下,所論的指標或差距在某個09/01 10:48
24F→: 範圍之內。而固定信賴水準的信賴區間,和固定顯著水準的檢09/01 10:51
25F→: 定有對應關係,例如衡量差異的指標參數是 m,1-a 信賴水準09/01 10:53
26F→: 下 m 的信賴區間如果包含特定值 m0,就表示依當前資料,在09/01 10:56
27F→: 1-a 信賴水準下 m0 是 m 的一個合理猜測;所以在顯著水準 a09/01 10:57
28F→: 之下,做 H0: m = m0 的檢定 H0 不應被拒絕;反之亦然。所09/01 11:02
29F→: 以固定水準下的信賴區間,同時也可做相應水準下 H0:m=m009/01 11:04
30F→: 對 Ha: m<>m0 的檢定;但信賴區間卻表明了所關心的差異指標09/01 11:06
31F→: 可能範圍,所以說信賴區間比相應顯著水準下的檢定提供更多09/01 11:08
32F→: 訊息。不過與 p 值相比,卻是難以比較。09/01 11:10
1F→: FWER 是假設要做的 k 個檢定其 H0 都成立,卻至少一個 H008/29 09:15
2F→: 被拒絕的機率;FDR 是被拒絕的 H0 中,有夕少其實 H0 沒錯08/29 09:17
3F→: 的比例。如果以疾病檢測來說,把每一個被檢測的人類比為待08/29 09:20
4F→: 檢定的假說,FWER是=(無病卻呈陽性)/(無病)08/29 09:22
5F→: FDR = (無病卻呈陽性)/(陽性)。這是兩個不能相互比較的比例08/29 09:24
6F→: 或條件機率。08/29 09:24
7F→: 更正:上面以疾病檢測對FWER的說明是錯的;最初的說明是對的08/29 09:30
8F→: 以疾病檢測來看,人數夠多幾乎必然出現假陽性,意謂FWER接08/29 09:31
9F→: 近 1,就如同一篇研究報告做了數十甚至數百檢定,即使真實08/29 09:33
10F→: 情況是所有 H0 都不應被拒絕,但實際上會出現一些 "顥著"08/29 09:35
11F→: 結論是很正常的。在疾狷檢測,(假陽性)/(正常) 比例相當於08/29 09:37
12F→: 單一假說檢定的型一誤機率,而 FWER 遠比這個大得多。08/29 09:39
13F→: 但無論如何,FWER 和 FDR 是不能比較的兩個概念。08/29 09:41