[問題] 線性回歸參數和應變數之估計
對於線性回歸問題,通常我們只考慮取一組樣本以估計該模型
的參數。
y(i) = b0+b1*x(i), i = 1 to k, k 是該組樣本的點數
利用 x 的樣本點來估算參數,b0 和 b1。
可既然 x 乃隨機變數,表示倘我們另取他組樣本做估計,所得
的參數估計值會有變化,而用該參數組模型所得預測值也會如此
。
那麼我們是否可透過下面方法估計這些參數和預測值的信心區
間?
取多組 x 的樣本,每組樣本可以給我們對應的參數組之值:
b0(j), b1(j); j = 1 to q, q 乃 x 樣本的組數
計算個別參數的樣本平均值︰ avg_b0 = sum( b0(j), j = 1 to q)/q
avg_b1 = sum( b1(j), j = 1 to q)/q
當然我們也可計算得到個別參數的樣本誤差: SE_b0, SE_b1
然後我們可得到信心區間的估計如下:
CI_b0 = avg_b0 +- SE_b0*Z(alpha)
CI_b1 = avg_b1 +- SE_b1*Z(alpha)
alpha 乃信心水準而 Z 是隨機變數(如標準常態分布或學生分布)
但是預測值 y 的信心區間的估計就麻煩了,因為它是對應到「固定」的
x 的值。
y(i,j) = b0(j)+b1(j)*x(i,j), i = 1 to k, j = 1 to q
所以不能用上面的方法估計 y(i,j) 的信心區間。
那麼如何得到這個估計區間呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.51.187 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1681815601.A.430.html
→
04/18 22:29,
2年前
, 1F
04/18 22:29, 1F
→
04/18 22:29,
2年前
, 2F
04/18 22:29, 2F
→
04/18 22:30,
2年前
, 3F
04/18 22:30, 3F
這裡的實驗,限制在打算測試新藥劑量(x)和療效(y)之間的關係。
所以不同的組別,是指不同家醫院對院內患者得到的樣本組。
當藥品的適應症沒有地區性,例如某些地區的人特別好發等,組別應該
和藥效(y)以及劑量(x)沒有關係。
※ 編輯: saltlake (114.24.51.187 臺灣), 04/18/2023 22:52:14
推
04/19 08:27,
2年前
, 4F
04/19 08:27, 4F
請問混和模型的意思是?
噓
04/20 08:17,
2年前
, 5F
04/20 08:17, 5F
噓
04/20 14:54,
2年前
, 6F
04/20 14:54, 6F
※ 編輯: saltlake (114.24.64.134 臺灣), 04/20/2023 21:31:45
→
04/20 22:26,
2年前
, 7F
04/20 22:26, 7F
→
04/20 22:26,
2年前
, 8F
04/20 22:26, 8F
→
04/20 22:28,
2年前
, 9F
04/20 22:28, 9F
→
04/20 22:28,
2年前
, 10F
04/20 22:28, 10F
推
04/20 22:33,
2年前
, 11F
04/20 22:33, 11F
→
04/20 22:33,
2年前
, 12F
04/20 22:33, 12F