Re: 統計方法學 幾呼成為神學的代名詞了,當代顯學。
※ 引述《citymale (炒股救地球)》之銘言:
: 想舉個例子和wush大大和liton大大說明一下好了。
: 假設現在有一群人,把他們分成兩邊。
: 一邊當出題者,一邊當應試者,兩方互不見面。
: 出題者有很多人,出來的題目不是只有單一特性,而是綜合所有出題者的想法。
: 應試者所能得到的訊息就是題目,而不知出題者有多少人。
: 應試者跟據題目,要去猜出題者的個性了,他要用何種方法呢?
: 1.歸類。這個方法可能有效,但如果某個題目是包含很多特性,可能就難以歸類了。
: 2.統計。根據1所做出來的結果,去做機率的統計。
: 也許應試者最後找出出題者的綜合特性了。
: 但這時出題者公佈答案了,他是把題目剪成一張一張的小紙片,然後用
: 電風扇去吹,選取比較遠的紙片。
: 那… 呃…
我想原po真的不了解統計在做什麼,我就用淺白的話告訴你(各位有錯請指正)
首先用一句話來說明統計推論==>"利用機率的敘述來量化抽樣誤差的大小"
用養豬場的例子:假設養豬場共有一萬頭豬…
今天我們有興趣的是母體的參數===>豬隻的平均體重,最簡單的方法就是一隻一隻
豬去量(普查),但是這個方法很浪費時間(如果不只五萬頭呢…),所以就隨機選了十隻
量體重(抽樣),那量出了十個體重有十個數字,你會用哪個數字去猜豬隻的平均體重呢
??
就算沒學過統計的人,直覺應該也會把十個數字除以十算得一個平均,將算出來的平均
去猜豬隻的平均體重,當然可能猜的中、可能猜不中,人們的認知裡應該是不會猜中,
運氣會有這麼好嗎…
當然猜不中我們會想知道跟真正的平均體重到底距離多遠(誤差),如果我告訴你算出來
的體重和真正的平均體重差距10kg的機率大於95%,那你覺得這句話是不是有意義多了
,我的直覺認為猜的還蠻準的…
因為母體太大沒辦法普查,所以必需抽樣,但是抽樣會有誤差稱抽樣誤差,所以必需用
機率的敘述來量化抽樣誤差的大小…
為什麼我們會想知道養豬場的平均體重呢…假設今天養豬場的老闆跟你說:我的養豬場
裡的豬全部五千萬賣你,平均一頭豬五千塊,那你查了一下知道市價一頭250公斤的豬
可以賣到五千塊,那麼老闆跟你說他養的豬平均一定超過250公斤,所以他的豬可以買
,當然你一定會懷疑老闆講的話是真是假,這時老闆就說了:那不然這樣子好了,讓你
到豬舍裡面抓50頭豬量牠們的體重,結果算出來的平均體重真的超過250公斤,那你可
能就傾向相信老問說的話…
而至於要不要購買就是決策,樣本資訊是影響決策依據,當然依據樣本資訊所做的決策
不一定正確,如果今天抓到的50隻剛好是養豬場裡前50重的豬(極端的情況),皆已超出
正常體重很多了(多不多要用標準差來衡量),必然會做購買的決策,但是其它的九千多
隻都比250公斤輕很多,必然全部的平均體重就小於250公斤=>虧錢,所以統計是在幫助
我們在有限的資訊下去進行決策,然而依據樣本做出決策對於否我們並不會知道,但是
我們可以控制犯型一錯誤發生的機率很小…
統計方法:我沒修過專門的統計方法,是不是這樣分就不確定了…
PART1-估計:利用樣本資訊直接進行推論
點估計:利用統計量進行估計
區間估計:利用隨機區間進行估計
PART2-假設檢定:
假設:對母體未知參數所作的敘述或描述
-按照立場的不同分成虛無假設(H0)、對立假設(H1)
檢定:樣本空間的分割,分割接受域和棄卻域
有母數統計學:
-有分配假設下的統計推論
-常態母體下的統計推論、Bernoulli母體下的統計推論
無母數統計學:
-所以有過程未涉及參數或分配的設定
-雖有分配或參數的設定,但其檢定統計量在虛無假設下的分配
與其設定無關
其中變異數分析、回歸分析都是在做假設檢定…應該說本質都是一樣的,只是推論的
對象不一樣,就是有興趣的參數不一樣,就因為有興趣的參數不一樣,所以統計推論
的方法不一樣,所以總稱統計方法吧…
還有你應該要知道的幾個名詞…
型1錯誤(type 1 error):錯誤的棄卻H0
型2錯誤(type 2 error):錯誤的接受H1
alpha風險:犯型1錯誤的機率
beta風險:犯型2錯誤的機率
例子二:買芭樂(不喜歡芭樂可以換香蕉...誤)
假設一箱芭樂共有100顆,裡面有幾顆是壞掉的不知道,壞掉的機率是10%
老闆說一箱裡面可以讓你拿10顆出來檢查…
虛無假設H0:壞掉的機率是10% 對立假設H1:壞掉的機率是超過10%
=>預期一箱芭樂裡面會有10顆壞掉的,壞掉的芭樂超過10顆你就不會買…
=>如果拿出的10顆裡面越多顆壞掉的就傾向於不會買…
<case1>:10顆裡面都是好的=>傾向於會買
<case1-1>:結果箱子裡面有15顆壞掉,只是剛好都沒被選到
錯誤決策==>以上犯了型2錯誤
<case1-2>:結果箱子裡面只有5顆壞掉
正確決策
<case2>:10顆裡面10顆都是壞的=>傾向於不會買
<case2-1>:結果箱子裡有十顆壞掉的,剛好都被選到
錯誤決策==>以上犯了型1錯誤
<case2-2>:結果箱子裡面有20顆壞掉的
正確決策
一個優良的檢定是在固定alpha風險下,尋求一個檢定具有較小的beta風險=>重alpha
(兩者風險的關係請你有興趣再翻一下統計課本)
重alpha則當alpha越小時(棄卻域越小、顯著水準越高),較不易拒絕H0=>H0為被保護
立場(欲否定立場),即為無足夠證據時不易使得H1成立…
註:顯著水準=1-alpha
呼,打了好久,我認真了>"<
最後回應你的問題,你要用統計方法來分析你的問題,你要先能夠把你所以的"特性"
轉化成為數值變數才能進行統計分析,而依據你想估計的參數選擇適合的統計方法,
不過我覺得你問的問題實在跟統計風、馬、牛不相關…反正你一開始就說你不懂統計
,所以也沒什時麼好苛責你…
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.37.140.178
→
12/31 10:47, , 1F
12/31 10:47, 1F
→
12/31 16:12, , 2F
12/31 16:12, 2F
推
12/31 22:17, , 3F
12/31 22:17, 3F
→
12/31 22:18, , 4F
12/31 22:18, 4F
→
12/31 22:18, , 5F
12/31 22:18, 5F
→
12/31 22:23, , 6F
12/31 22:23, 6F
→
12/31 22:24, , 7F
12/31 22:24, 7F
→
12/31 22:24, , 8F
12/31 22:24, 8F
推
12/31 22:59, , 9F
12/31 22:59, 9F
推
01/01 11:02, , 10F
01/01 11:02, 10F
推
01/01 20:36, , 11F
01/01 20:36, 11F
推
01/01 21:29, , 12F
01/01 21:29, 12F
回j大和l大…
其實也不一定阿,我的出發點也不是只有打給開文的人看的…
算是有點拋磚引玉,希望借這篇文讓更多人提出一些自己看法…
說不定其他人對統計有別的見解,我也可以因此受益…謝謝唷!!
關於這兩個例子並不是我自己想出來的,是我的統計老師在上課中舉的例子…
因為我覺得這個例子還不錯,即使修完課好幾年我都還記得…就分享給大家…
※ 編輯: chris006 來自: 114.37.140.178 (01/01 22:25)
推
01/02 01:55, , 13F
01/02 01:55, 13F
→
01/02 01:56, , 14F
01/02 01:56, 14F
推
01/02 02:52, , 15F
01/02 02:52, 15F
→
01/03 02:28, , 16F
01/03 02:28, 16F
推
01/04 00:58, , 17F
01/04 00:58, 17F
推
01/04 15:09, , 18F
01/04 15:09, 18F
推
01/10 01:11, , 19F
01/10 01:11, 19F
→
01/15 00:39, , 20F
01/15 00:39, 20F
→
01/02 15:02,
5年前
, 21F
01/02 15:02, 21F
討論串 (同標題文章)
完整討論串 (本文為第 5 之 5 篇):