[問題] 用原始數據和平均後數據做t-test的準確度

看板Statistics作者 (亂風)時間14年前 (2011/07/04 22:39), 編輯推噓2(2029)
留言31則, 5人參與, 最新討論串1/1
不好意思 想問問大家t-test怎麼做準確度比較高 因為我不是學統計的 但做生物性實驗資料都需要用統計來驗證 但最近有個奇怪情況有點搞不太懂 我總共有170個樣本資料 不過這170組資料是從六次的不等樣本數量 在同一個實驗流程和參數下做出來的 我是把六次總共170個樣本數的資料直接和對照組做t-test 那都可以得到具有差異的p值(<0.05) 但學長又建議我把六次分別平均 剩下六組平均後數據 再和對照組做t-test 差異性就都不見了= = p值都變高很多 學長原本認為我的樣本數大 所以error bar很小 因此輕易就能test出差異 但實質上說不定是無差異的 請問一下專業的各位哪一種方法才是比較準確的?? 我對平均後差異性消失也有點百思不解....真的是因為數量的關係嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.32.224.66

07/04 23:11, , 1F
已知機率的Type I error與未知機率的Type II error,
07/04 23:11, 1F

07/04 23:12, , 2F
你喜歡面對哪一個呢?^^a
07/04 23:12, 2F

07/04 23:16, , 3F
把原有的大樣本變成極小樣本是自廢武功啊~~樣品永遠不嫌多
07/04 23:16, 3F

07/04 23:27, , 4F
六次的不等樣本數量 , 你要怎麼平均?
07/04 23:27, 4F
恩恩~就是六個平均數~

07/04 23:28, , 5F
如果是拿六個平均數 V.S. 控制組 , 平均數具有不偏性
07/04 23:28, 5F

07/04 23:29, , 6F
那變異數就會變很小,然後另一方面樣本數也變小,當然不顯著
07/04 23:29, 6F
所以還是應該以原始數據一起下去做檢定比較好囉? ※ 編輯: dfghpt 來自: 114.32.224.66 (07/05 02:33)

07/05 13:45, , 7F
6組是同一人做的嗎? 時間夠近嗎? 你感覺實驗的準度夠嗎?
07/05 13:45, 7F

07/05 13:51, , 8F
如果看來看去6組都沒甚麼差 (觀察平均數和變異數)
07/05 13:51, 8F

07/05 13:52, , 9F
那就像你現在這樣 170 V.S. 控制組就好了
07/05 13:52, 9F

07/05 13:52, , 10F
若差很多,那可能要考慮meta-analysis的fixed effect model
07/05 13:52, 10F

07/06 14:29, , 11F
題外話問一下 提建議的學長 對統計了解多少
07/06 14:29, 11F
他學生物的 所以他也不太懂= =

07/06 15:45, , 12F
重點應是你的「統計單位」是什麼. 一個單位一個重複數
07/06 15:45, 12F
統計單位是時間 在實驗中每個樣本有出現反應的時間 重複數通常只有一個媽@@?

07/06 15:46, , 13F
當然有是有先平均再檢定的情況, 但也是統計單位內的平均.
07/06 15:46, 13F

07/06 15:47, , 14F
至於樣本多易達顯著, 這可預期, 但顯著的意義為何別搞錯.
07/06 15:47, 14F

07/06 15:48, , 15F
顯著與否也不一定能表達差異量, 以上小小提醒.
07/06 15:48, 15F
這邊有點不太懂@@ 所以應該增加實驗次數來更顯示差異性? ※ 編輯: dfghpt 來自: 114.32.224.66 (07/06 20:48)

07/06 22:22, , 16F
我猜你誤會統計單位的意思. 例如調查學生身高, 則統計單
07/06 22:22, 16F

07/06 22:23, , 17F
位為「一位學生」, 而使一位學生的身高為一個重覆數.
07/06 22:23, 17F

07/06 22:24, , 18F
至於重覆數多能幹嘛, 老生常談就是提高檢定力 (power),
07/06 22:24, 18F

07/06 22:25, , 19F
但檢定常常只指出是否有差別, 但不一定能指出差別多少.
07/06 22:25, 19F

07/06 22:25, , 20F
所以 "有沒有差" 和 "差多少" 不要一概而論即可.
07/06 22:25, 20F

07/06 22:32, , 21F
意思就是有顯著就有顯著啦, 但差多少要再看看.
07/06 22:32, 21F

07/07 00:06, , 22F
把六次樣本,總和樣本,控制組 的 1.樣本數 2.平均 3.標準差
07/07 00:06, 22F

07/07 00:06, , 23F
都列出來看看如何?
07/07 00:06, 23F

07/08 19:31, , 24F
問題及資料不大了解.
07/08 19:31, 24F

07/08 19:32, , 25F
設 X(i,j)~i.i.d. N(μ,σ^2), j=1,..,Ni, i=1,...,k.
07/08 19:32, 25F

07/08 19:34, , 26F
要檢定 H0:μ=μ0, 最佳檢定策略是用所有 n=ΣNi 個觀測值做
07/08 19:34, 26F

07/08 19:34, , 27F
t 檢定. 今若計算 Y(i) =Σ{X(i,j): j=1,...,Ni}/Ni, 而用
07/08 19:34, 27F

07/08 19:35, , 28F
Y(i), i=1,...,k 當觀測值做普通 t 檢定, 則:
07/08 19:35, 28F

07/08 19:36, , 29F
(1) 當 Ni 不等, 如本例, 結果是錯的! 因 Y(i) 變異數不等.
07/08 19:36, 29F

07/08 19:37, , 30F
(2) 若所有 Ni 均相同,即等樣本情形, 用 Y(i) 而不用 X(i,j)
07/08 19:37, 30F

07/08 19:38, , 31F
是沒效率的, 因誤差自由度由 n-1 驟減為 k-1.
07/08 19:38, 31F
文章代碼(AID): #1E4T2QiN (Statistics)