[問題] 兩組數據平均後相除之自由度問題

看板Statistics作者 (異羽)時間12年前 (2014/02/13 14:02), 編輯推噓0(0028)
留言28則, 3人參與, 最新討論串1/1
在版上搜尋幾個與自由度相關的問題後,發現大家的問題比我想知道的難很多。 教科書裡也找不到相關的例子,不知道自己的盲點該怎麼解決。 雖然例子是實際實驗所測得的,但是很難以三言兩語描述清楚。 所以現在提出的情境是一個類比的問題: 假設有A, B兩個物體,各取樣測量其質量、體積5次取平均值 (實驗中測過體積的樣品無法再測其質量,反之亦然) 得到A質量m_A,B質量m_B,得到A體積v_A,B體積v_B。 各自求得平均及SE。現欲以t test比較A, B兩物體之密度。 密度計算:d_A = m_A-bar / v_A-bar, 密度的SE: d_A * ((SE(m_A)/m_A-bar)^2 + (SE(v_A)/v_A-bar)^2)^0.5 如果要使用t test就必須知道df,原本並沒有想太多就直接使用 5 - 1 = 4。 但又想起各別的密度是兩項相除的結果,倘若兩項的取樣數不同就無從參考起了。 想了幾天後,又覺得是 5 + 5 - 2 = 8。但自己統計相關的知識實在不是很足夠。 所以特來請教各位,希望能破除自己的盲點。謝謝! 此外,"R"所使用的t.test似乎只能用於一群數字,而無法檢定此例中的密度。 現在仍是使用Excel列出t test的p-value表進行分析。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.120.104.77 ※ 編輯: muscidae 來自: 140.120.104.77 (02/13 14:03)

02/13 17:16, , 1F
複雜的統計量, 且樣本數甚小, 難以用 t 分布近似.
02/13 17:16, 1F

02/14 00:35, , 2F
有趣的問題.
02/14 00:35, 2F

02/14 00:38, , 3F
不知道我想的對不對:這個要用t-test可能不太容易。
02/14 00:38, 3F

02/14 00:39, , 4F
因為沒辦法取得重覆樣本(沒辦法同時量重量和體積)。
02/14 00:39, 4F

02/14 01:10, , 5F
不知道大樣本的條件下建構Z值來檢驗有沒有可能?
02/14 01:10, 5F

02/14 10:21, , 6F
我讀到一些資料建議:樣本數小要使用無母數的分析方式,
02/14 10:21, 6F

02/14 10:23, , 7F
但是要用來分析此例中的密度,感覺更不可能了。
02/14 10:23, 7F

02/14 18:09, , 8F
他是 A, B 各測量 m 及 v 5次, 得平均值為 m 及 v 真值之估
02/14 18:09, 8F

02/14 18:10, , 9F
計, 然後據此計算密度估計, 目的要比較 A, B 兩物之密度是否
02/14 18:10, 9F

02/14 18:12, , 10F
相等. 若測量次數夠多, 而不僅是 5次, 可引用 delta-method
02/14 18:12, 10F

02/14 18:14, , 11F
主張密度估計值之布抽樣分布近似常態. 但僅測量5次不宜做此
02/14 18:14, 11F

02/14 18:14, , 12F
假設.
02/14 18:14, 12F

02/17 10:57, , 13F
嗯,所以首先要增加樣本數。並且確認抽樣分布近似常態。
02/17 10:57, 13F

02/17 11:01, , 14F
然後進行Z檢定,那樣本數取>30是否恰當?
02/17 11:01, 14F

02/17 11:02, , 15F
密度標準差可以使用此例中之SE計算公式,代入計算嗎?
02/17 11:02, 15F

02/18 18:22, , 16F
(1) 要各測量幾次才足以引用 delta-method 主張近似常態我不
02/18 18:22, 16F

02/18 18:22, , 17F
清楚.
02/18 18:22, 17F

02/18 18:23, , 18F
(2) m 及 v 測量時難免有相關. 你引用的公式是假設它們是獨
02/18 18:23, 18F

02/18 18:24, , 19F
立的. 究竟能不能假設獨立進行計算我不能肯定.
02/18 18:24, 19F

02/18 18:26, , 20F
嗯, 凡看你的說明, 體積與質量不是測同一物的, 那麼假設
02/18 18:26, 20F

02/18 18:27, , 21F
它們獨立是可以的. 不過, 這樣可能至少體積的測量次數可
02/18 18:27, 21F

02/18 18:28, , 22F
能需要更大些.
02/18 18:28, 22F

02/18 18:29, , 23F
理論上, 當測量數夠多, 使得 m 及 v 的平均, 也就是真值的估
02/18 18:29, 23F

02/18 18:31, , 24F
計值可以視為常態變量之觀測值. 在兩者相互獨立的假設之下,
02/18 18:31, 24F

02/18 18:32, , 25F
密度的估計是兩個(相互獨立的)常態變量相除, 結果並不是常態
02/18 18:32, 25F

02/18 18:33, , 26F
分布. d = m/v 是否能用常態近似, 除了 m 要近似常態之外,
02/18 18:33, 26F

02/18 18:34, , 27F
v 的變異係數應該要夠小吧.
02/18 18:34, 27F

02/19 11:56, , 28F
謝謝大家,雖然實驗設計變得很困難。但是釐清了我不少盲點
02/19 11:56, 28F
文章代碼(AID): #1I_601i2 (Statistics)