[問題] 變異數和信心區間寬度

看板Statistics作者 (SaltLake)時間2年前 (2022/01/12 11:54), 2年前編輯推噓4(4039)
留言43則, 6人參與, 2年前最新討論串1/1
取得一個樣本之後,如果它的變異數小,那麼它的 精確度或者說可靠度比較高。 那如果我們做統計推論,根據樣本算出的信心區間 的寬度比較窄,是否表示估計的平均值落於較窄區 間而更可靠? 或者說,信心區間的寬度有什麼統計 上的意義? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.72.32 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1641959657.A.3B7.html

01/12 17:48, 2年前 , 1F
這是要用比較的,兩個不同treatment 的 interval 寬
01/12 17:48, 1F

01/12 17:48, 2年前 , 2F
度不同但是 coverage probability 一樣,就會選擇窄一
01/12 17:48, 2F

01/12 17:48, 2年前 , 3F
點的
01/12 17:48, 3F
這邊還有個問題是,即使是同一種處置,根據每次抽樣所得的樣本所計算的 信心區間寬度也會不同。換言之這信心區間寬度本身也是隨機變數。 所以問題其實有二,首先最基本的是,抽樣所得信心區間寬度的數值 有什麼統計意義。其二是,怎樣估計這個信心區間寬度?多次抽樣估 計後取平均值嗎? ※ 編輯: saltlake (114.24.72.32 臺灣), 01/12/2022 22:44:14

01/13 01:37, 2年前 , 4F
關於統計意義,我的理解是:樣本平均值介於上界跟下界之間
01/13 01:37, 4F

01/13 01:37, 2年前 , 5F
的機率(例如在95%的信心水準下,代表算100次的樣本平均值有
01/13 01:37, 5F

01/13 01:37, 2年前 , 6F
95次會在這個區間中)。至於需不需要真的算100次樣本平均然
01/13 01:37, 6F

01/13 01:37, 2年前 , 7F
後再把每一次的上下界平均,取得一個平均的上下界,答案是
01/13 01:37, 7F

01/13 01:37, 2年前 , 8F
不用(應該)。因為只要是對同一個母體做隨機抽樣,則做成對t
01/13 01:37, 8F

01/13 01:37, 2年前 , 9F
檢定應該會發現無法拒絕虛無假說,所以雖然每一次抽樣本算
01/13 01:37, 9F

01/13 01:37, 2年前 , 10F
出來的樣本平均值跟上下界有所變化,但基本上不會相差太多
01/13 01:37, 10F

01/13 01:37, 2年前 , 11F
,所以不用拘泥於每一次算出來的上下界不一樣這件事。(就算
01/13 01:37, 11F

01/13 01:37, 2年前 , 12F
你取上下界的平均好了,也不過就是一個值,而且跟任何一次
01/13 01:37, 12F

01/13 01:37, 2年前 , 13F
抽樣的上下界結果比較也是無法拒絕虛無假說)
01/13 01:37, 13F
換言之,每次取樣計算信心區間的意義,僅在於查看該此樣本平均值是否落於 區間內。倘是者則統計顯著,反之則否。 這其實和每次取樣計算 p 值的功用相同,只看該值是否小於顯著水準以判定 是否統計顯著。 這樣看來,每次取樣計算信心區間和計算 p 值的目的和公用完全一致。但是 文獻上有爭執論文應該 1. 給信心區間 2. 給 p 值 3. 給兩者。 其中第一種認為給信心區間「能做出給多統計解釋」。但從上面討論實在看不出。 ※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 09:29:44

01/13 11:11, 2年前 , 14F
區間是否包括假設值,和區間的上下界值為何,是解釋不
01/13 11:11, 14F
^^^^^^^^^^^^^^^^ 這是假說檢定

01/13 11:11, 2年前 , 15F
同事情。
01/13 11:11, 15F

01/13 11:12, 2年前 , 16F
不同在於你傾向假說檢驗還是參數估計。
01/13 11:12, 16F
所以是說,如果用樣本計算出信心區間,除了可檢查假設值是否在區間內而 檢定假說,還可進一步從區間寬度判斷樣本參數的可靠度? 例如參數是準確度 ,則其信心區間窄表示這個樣本對該參數的估計比較可靠? ※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 12:27:18

01/13 12:36, 2年前 , 17F
感覺好像也不是說比較可靠耶(搔頭),只要是在同樣的信心水
01/13 12:36, 17F

01/13 12:36, 2年前 , 18F
準下,寬或窄都一樣可靠啊。只能說根據抽樣資料的分佈情形
01/13 12:36, 18F

01/13 12:36, 2年前 , 19F
,窄的表示樣本平均值的變異比較小,用來估計母體參數的變
01/13 12:36, 19F

01/13 12:36, 2年前 , 20F
異也比較小,應該是這樣…吧?
01/13 12:36, 20F

01/13 14:24, 2年前 , 21F
其實我覺得信賴區間可以對統計結果多做解釋是對的,
01/13 14:24, 21F

01/13 14:24, 2年前 , 22F
畢竟他可以直接對母體平均給出上下界,但pvalue就是
01/13 14:24, 22F

01/13 14:24, 2年前 , 23F
單純對假設檢定給出有沒有拒絕而已。就是信賴區間除
01/13 14:24, 23F

01/13 14:24, 2年前 , 24F
了可以看有沒有拒絕之外,也可以再推論一些東西
01/13 14:24, 24F

01/13 14:34, 2年前 , 25F
一個民調的95%區間20%+/-3%,這叫估計不叫假說檢定。
01/13 14:34, 25F

01/13 14:36, 2年前 , 26F
20%+/-3%不包括25%,因此拒絕H0:theta=25%,這才叫檢定
01/13 14:36, 26F

01/13 14:38, 2年前 , 27F
另一個方法對同母體可得95%區間為+/-1%,那叫更可靠。
01/13 14:38, 27F

01/13 15:49, 2年前 , 28F
信賴區間不是母體平均的上下界 95%也不是母體平均
01/13 15:49, 28F

01/13 15:49, 2年前 , 29F
落在這個區間裡的機率!
01/13 15:49, 29F

01/13 15:56, 2年前 , 30F

01/13 16:01, 2年前 , 31F
這篇的討論看一下吧 你的問題還有上面推文正好就是
01/13 16:01, 31F

01/13 16:01, 2年前 , 32F
他指出的三大fallacies
01/13 16:01, 32F

01/13 17:43, 2年前 , 33F
95%就代表Type 1 Error是5%,可靠程度就是95%信賴水準或是5
01/13 17:43, 33F

01/13 17:43, 2年前 , 34F
%顯著水準,跟寬窄沒關係
01/13 17:43, 34F

01/13 17:50, 2年前 , 35F
也不能說跟寬窄沒關係,你信賴水準越高當然也就越寬不過這
01/13 17:50, 35F

01/13 17:50, 2年前 , 36F
沒什麼意義,我說你0-200歲一定會死,雖然是一定準但有意義
01/13 17:50, 36F

01/13 17:50, 2年前 , 37F
01/13 17:50, 37F

01/13 17:52, 2年前 , 38F
也就是說在大家比較接受的95%信賴水準,寬窄是根據你的隨機
01/13 17:52, 38F

01/13 17:52, 2年前 , 39F
誤差大小,但實驗比較care的是你的隨機誤差是否符合線性模
01/13 17:52, 39F

01/13 17:52, 2年前 , 40F
型而已
01/13 17:52, 40F
意思是: 目標變數 = X (隨機變數) + e (隨機誤差)? 如果誤差是二次或其他函數,目前統計課本的公式不能用?

01/13 18:01, 2年前 , 41F
符合線性模型代表你的實驗因素是有顯著影響,不符合的話你
01/13 18:01, 41F

01/13 18:01, 2年前 , 42F
就需要找非實驗因素控制從錯誤的隨機誤差切一塊出來來達成
01/13 18:01, 42F

01/13 18:01, 2年前 , 43F
線性模型
01/13 18:01, 43F
※ 編輯: saltlake (114.24.72.32 臺灣), 01/13/2022 20:47:12
文章代碼(AID): #1Xtb3fEt (Statistics)