[問題] 研究樣本比研究母體結果更精確?

看板Statistics作者 (OWOOO)時間7年前 (2018/10/13 18:21), 7年前編輯推噓1(1054)
留言55則, 5人參與, 7年前最新討論串1/2 (看更多)
覺得可能是很小白的問題,不過跟同學討論之後得不出結果, 所以想說來板上問問看。 講義上面在提到「研究時取樣的好處」時有一個敘述如下: 根據樣本取得的結果大多數時後會比根據母體取得的結果更準確(accurate)。 其他的比如研究樣本比研究母體更便宜更有可行性更快速等等之類的都可以理解, 但得到的結果會比研究母體更精確這個敘述有點看不太懂。 (這個地方老師很快就帶過去了,並沒有針對這句敘述多做說明。) 不知道是我對於accurate這個英文字的解釋不對或是如何。 為什麼研究樣本會比研究母體更精確呢? 一般來講,不是都是說研究樣本會有誤差嗎? 在這裡先謝謝願意一起討論或解答的版友~~ 單純聽老師上課時此處並未多做著墨,聽過去覺得好像都懂,沒想到回頭過來看講義時卻 出現奇妙的問題QWQQ https://i.imgur.com/YP0jx28.jpg
補一下講義翻拍照片,是第四項。 開始擔心難道我除了數學不行以外英文也不行了嗎QWQQQ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.176.56.186 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1539426060.A.0B3.html

10/13 23:06, 7年前 , 1F
把整段文字貼出來看看?這句話實在狗屁不通
10/13 23:06, 1F
已經補上照片了~~

10/14 00:40, 7年前 , 2F
取樣這個動作本質上是要對母體的某些表現作近似
10/14 00:40, 2F
近似的話,那應該不會比母體要準才對? ※ 編輯: kiyounin (180.176.56.186), 10/14/2018 02:15:09

10/14 03:56, 7年前 , 3F
那個意思應該是“結果“更加精確,準確,大概是指你在測
10/14 03:56, 3F

10/14 03:56, 7年前 , 4F
量或是收集資訊的時候的誤差,而且他用通常,並不是絕對
10/14 03:56, 4F

10/14 07:54, 7年前 , 5F
這是在說抽樣調查相對於普查的優點. 前面有人問到樣本是否
10/14 07:54, 5F

10/14 07:57, 7年前 , 6F
越大越好時我就提到: 樣本過大從準確度而言不一定更好. 這
10/14 07:57, 6F

10/14 07:58, 7年前 , 7F
是因調查實務上存在許多來源的非抽樣誤差, 而在普查或超大
10/14 07:58, 7F

10/14 08:00, 7年前 , 8F
型抽樣調查中, 非抽樣誤差的某些來源可能更不容易控制而致
10/14 08:00, 8F

10/14 08:02, 7年前 , 9F
總誤差(抽樣及非抽樣誤差)反而增大, 也就是準確度下降.
10/14 08:02, 9F

10/14 08:04, 7年前 , 10F
所謂準確度, 是在精確度之外還耍考慮偏誤. 隨機抽樣本身造
10/14 08:04, 10F

10/14 08:06, 7年前 , 11F
成精確度的喪失(也就是產生抽樣誤差), 但謂查中的無答覆或
10/14 08:06, 11F

10/14 08:09, 7年前 , 12F
有意無意的答覆偏差, 調查人員造假資料等, 則造成調查結果
10/14 08:09, 12F

10/14 08:11, 7年前 , 13F
的失真. 在較小的抽樣調查中, 這種非抽樣誤差比較好控制(避
10/14 08:11, 13F

10/14 08:13, 7年前 , 14F
免), 而在超大樣本調查或普查中, 則較不容易控制或容易疏忽
10/14 08:13, 14F

10/14 08:15, 7年前 , 15F
所以說, 普查的準碓度(accuracy)也有可能反不及抽樣調查.
10/14 08:15, 15F

10/14 08:20, 7年前 , 16F
用以衡量精確度(precision)的是 variance, 而衡量準確度
10/14 08:20, 16F

10/14 08:21, 7年前 , 17F
(accuracy)的是 mean sauared error, MSE = var +(bias)^2
10/14 08:21, 17F

10/14 08:22, 7年前 , 18F
squared
10/14 08:22, 18F
原來是這樣0口0 謝謝版友們的回答與討論~~ ※ 編輯: kiyounin (180.176.56.186), 10/14/2018 12:29:42

10/22 01:52, 7年前 , 19F
上面的網友說的都很詳細,
10/22 01:52, 19F

10/22 01:52, 7年前 , 20F
我這邊想講一個實際的案例 ,
10/22 01:52, 20F

10/22 01:52, 7年前 , 21F
你參考看看,
10/22 01:52, 21F

10/22 01:52, 7年前 , 22F
如果我要知道台灣地區23000000人口的平均身高是多少
10/22 01:52, 22F

10/22 01:52, 7年前 , 23F
的話?
10/22 01:52, 23F

10/22 01:52, 7年前 , 24F
第一個我可以從北到南抽樣假設100個人好了。
10/22 01:52, 24F

10/22 01:52, 7年前 , 25F
( 這件事會比較容易做 ,
10/22 01:52, 25F

10/22 01:52, 7年前 , 26F
你測量完以後,
10/22 01:52, 26F

10/22 01:52, 7年前 , 27F
頭也不會暈,
10/22 01:52, 27F

10/22 01:52, 7年前 , 28F
電腦也好 key in )。
10/22 01:52, 28F

10/22 01:52, 7年前 , 29F
但是,
10/22 01:52, 29F

10/22 01:52, 7年前 , 30F
就是這個但是,
10/22 01:52, 30F

10/22 01:52, 7年前 , 31F
如果你自己一個人真的把台灣23000000人一個一個找來
10/22 01:52, 31F

10/22 01:52, 7年前 , 32F
量身高!
10/22 01:52, 32F

10/22 01:52, 7年前 , 33F
這件事對於一般人來講幾乎是不可能達成的任務。
10/22 01:52, 33F

10/22 01:52, 7年前 , 34F
何況在測量過程之中可能會遇到非抽樣誤差,
10/22 01:52, 34F

10/22 01:52, 7年前 , 35F
( 譬如測量人員太累,
10/22 01:52, 35F

10/22 01:52, 7年前 , 36F
結果把身高的數目字登記錯誤)
10/22 01:52, 36F

10/22 01:52, 7年前 , 37F
如果只有你一個人在做這件事情的話, 我想你做3年也
10/22 01:52, 37F

10/22 01:52, 7年前 , 38F
做不完。
10/22 01:52, 38F

10/22 01:52, 7年前 , 39F
所以對母體作普查,
10/22 01:52, 39F

10/22 01:52, 7年前 , 40F
得到的結果反而可能是不精確的。
10/22 01:52, 40F

10/22 01:52, 7年前 , 41F
實務的觀點,
10/22 01:52, 41F

10/22 01:52, 7年前 , 42F
你一個人去做這件事情的話 會因為太累而錯誤百出。
10/22 01:52, 42F

10/22 01:52, 7年前 , 43F
這一句英文講得不太詳細。
10/22 01:52, 43F

10/22 01:52, 7年前 , 44F
中間有一些應該要解釋的話他沒有講,
10/22 01:52, 44F

10/22 01:52, 7年前 , 45F
直接講結論。
10/22 01:52, 45F

10/22 01:52, 7年前 , 46F
仁兄你的英文翻譯是沒有問題,
10/22 01:52, 46F

10/22 01:52, 7年前 , 47F
是這位英文作者講話講太快,
10/22 01:52, 47F

10/22 01:52, 7年前 , 48F
沒有把原因寫出來。
10/22 01:52, 48F

10/22 01:52, 7年前 , 49F
我的看法是這樣的。
10/22 01:52, 49F

11/20 17:29, 7年前 , 50F
這一篇文章跟你的問題很類似。
11/20 17:29, 50F

11/20 17:29, 7年前 , 51F
雖然他是從大數據著手去講這個問題。
11/20 17:29, 51F

11/20 17:29, 7年前 , 52F
參考一下。
11/20 17:29, 52F

11/20 17:29, 7年前 , 53F

11/20 17:29, 7年前 , 54F
v_3fCzpeA4Vdk0rQxA0EcXTq2cBCLGRlExpHH5CZzJmCXWh5Y
11/20 17:29, 54F

11/20 17:29, 7年前 , 55F
ZHA
11/20 17:29, 55F
文章代碼(AID): #1RmSSC2p (Statistics)
文章代碼(AID): #1RmSSC2p (Statistics)