[問題] 線性迴歸的斜率準確度
看到一個方法 想請教大家意見
一般來說
運用兩組對應的30筆的資料來計算迴歸
可得到他的迴歸線的斜率
而這斜率的95%信賴區間是此斜率加減約兩倍的標準誤
代表95%的信心水準下 真實斜率會落在此區間內
但若是從30筆中任意取兩筆出來 將這兩筆的X變數相減 y變數也相減
就可以得到相對應的dx和dy
這樣可以把樣本從30個 增加到30*29/2=435筆 (30筆中任取兩筆 共有435種組合)
以這435個資料點所計算出來的P-value會減少很多
斜率的標準誤也會減少 所以95%的信賴區間也會縮小
因此可以說算出的斜率結果更為顯著
但是總覺得怪怪的 為什麼只靠這樣相減就可以增加樣本數
這方法有甚麼問題嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.132.39.106
※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1414494143.A.245.html
→
10/28 23:02, , 1F
10/28 23:02, 1F
→
10/28 23:04, , 2F
10/28 23:04, 2F
→
10/28 23:04, , 3F
10/28 23:04, 3F
是30組(x,y)
請問標準誤不正確是指以此方法算出的標準誤不正確嗎? 還是指我的定義說錯了?
※ 編輯: Tarantino (1.34.39.236), 10/29/2014 20:50:40
→
10/31 18:48, , 4F
10/31 18:48, 4F
→
10/31 18:50, , 5F
10/31 18:50, 5F
→
10/31 18:52, , 6F
10/31 18:52, 6F
→
10/31 18:53, , 7F
10/31 18:53, 7F