Re: 統計方法學 幾呼成為神學的代名詞了,當代顯學。

看板Statistics作者 (= =")時間14年前 (2009/12/31 05:38), 編輯推噓10(10011)
留言21則, 15人參與, 5年前最新討論串5/5 (看更多)
※ 引述《citymale (炒股救地球)》之銘言: : 想舉個例子和wush大大和liton大大說明一下好了。 : 假設現在有一群人,把他們分成兩邊。 : 一邊當出題者,一邊當應試者,兩方互不見面。 : 出題者有很多人,出來的題目不是只有單一特性,而是綜合所有出題者的想法。 : 應試者所能得到的訊息就是題目,而不知出題者有多少人。 : 應試者跟據題目,要去猜出題者的個性了,他要用何種方法呢? : 1.歸類。這個方法可能有效,但如果某個題目是包含很多特性,可能就難以歸類了。 : 2.統計。根據1所做出來的結果,去做機率的統計。 : 也許應試者最後找出出題者的綜合特性了。 : 但這時出題者公佈答案了,他是把題目剪成一張一張的小紙片,然後用 : 電風扇去吹,選取比較遠的紙片。 : 那… 呃… 我想原po真的不了解統計在做什麼,我就用淺白的話告訴你(各位有錯請指正) 首先用一句話來說明統計推論==>"利用機率的敘述來量化抽樣誤差的大小" 用養豬場的例子:假設養豬場共有一萬頭豬… 今天我們有興趣的是母體的參數===>豬隻的平均體重,最簡單的方法就是一隻一隻 豬去量(普查),但是這個方法很浪費時間(如果不只五萬頭呢…),所以就隨機選了十隻 量體重(抽樣),那量出了十個體重有十個數字,你會用哪個數字去猜豬隻的平均體重呢 ?? 就算沒學過統計的人,直覺應該也會把十個數字除以十算得一個平均,將算出來的平均 去猜豬隻的平均體重,當然可能猜的中、可能猜不中,人們的認知裡應該是不會猜中, 運氣會有這麼好嗎… 當然猜不中我們會想知道跟真正的平均體重到底距離多遠(誤差),如果我告訴你算出來 的體重和真正的平均體重差距10kg的機率大於95%,那你覺得這句話是不是有意義多了 ,我的直覺認為猜的還蠻準的… 因為母體太大沒辦法普查,所以必需抽樣,但是抽樣會有誤差稱抽樣誤差,所以必需用 機率的敘述來量化抽樣誤差的大小… 為什麼我們會想知道養豬場的平均體重呢…假設今天養豬場的老闆跟你說:我的養豬場 裡的豬全部五千萬賣你,平均一頭豬五千塊,那你查了一下知道市價一頭250公斤的豬 可以賣到五千塊,那麼老闆跟你說他養的豬平均一定超過250公斤,所以他的豬可以買 ,當然你一定會懷疑老闆講的話是真是假,這時老闆就說了:那不然這樣子好了,讓你 到豬舍裡面抓50頭豬量牠們的體重,結果算出來的平均體重真的超過250公斤,那你可 能就傾向相信老問說的話… 而至於要不要購買就是決策,樣本資訊是影響決策依據,當然依據樣本資訊所做的決策 不一定正確,如果今天抓到的50隻剛好是養豬場裡前50重的豬(極端的情況),皆已超出 正常體重很多了(多不多要用標準差來衡量),必然會做購買的決策,但是其它的九千多 隻都比250公斤輕很多,必然全部的平均體重就小於250公斤=>虧錢,所以統計是在幫助 我們在有限的資訊下去進行決策,然而依據樣本做出決策對於否我們並不會知道,但是 我們可以控制犯型一錯誤發生的機率很小… 統計方法:我沒修過專門的統計方法,是不是這樣分就不確定了… PART1-估計:利用樣本資訊直接進行推論 點估計:利用統計量進行估計 區間估計:利用隨機區間進行估計 PART2-假設檢定: 假設:對母體未知參數所作的敘述或描述 -按照立場的不同分成虛無假設(H0)、對立假設(H1) 檢定:樣本空間的分割,分割接受域和棄卻域 有母數統計學: -有分配假設下的統計推論 -常態母體下的統計推論、Bernoulli母體下的統計推論 無母數統計學: -所以有過程未涉及參數或分配的設定 -雖有分配或參數的設定,但其檢定統計量在虛無假設下的分配 與其設定無關 其中變異數分析、回歸分析都是在做假設檢定…應該說本質都是一樣的,只是推論的 對象不一樣,就是有興趣的參數不一樣,就因為有興趣的參數不一樣,所以統計推論 的方法不一樣,所以總稱統計方法吧… 還有你應該要知道的幾個名詞… 型1錯誤(type 1 error):錯誤的棄卻H0 型2錯誤(type 2 error):錯誤的接受H1 alpha風險:犯型1錯誤的機率 beta風險:犯型2錯誤的機率 例子二:買芭樂(不喜歡芭樂可以換香蕉...誤) 假設一箱芭樂共有100顆,裡面有幾顆是壞掉的不知道,壞掉的機率是10% 老闆說一箱裡面可以讓你拿10顆出來檢查… 虛無假設H0:壞掉的機率是10% 對立假設H1:壞掉的機率是超過10% =>預期一箱芭樂裡面會有10顆壞掉的,壞掉的芭樂超過10顆你就不會買… =>如果拿出的10顆裡面越多顆壞掉的就傾向於不會買… <case1>:10顆裡面都是好的=>傾向於會買 <case1-1>:結果箱子裡面有15顆壞掉,只是剛好都沒被選到 錯誤決策==>以上犯了型2錯誤 <case1-2>:結果箱子裡面只有5顆壞掉 正確決策 <case2>:10顆裡面10顆都是壞的=>傾向於不會買 <case2-1>:結果箱子裡有十顆壞掉的,剛好都被選到 錯誤決策==>以上犯了型1錯誤 <case2-2>:結果箱子裡面有20顆壞掉的 正確決策 一個優良的檢定是在固定alpha風險下,尋求一個檢定具有較小的beta風險=>重alpha (兩者風險的關係請你有興趣再翻一下統計課本) 重alpha則當alpha越小時(棄卻域越小、顯著水準越高),較不易拒絕H0=>H0為被保護 立場(欲否定立場),即為無足夠證據時不易使得H1成立… 註:顯著水準=1-alpha 呼,打了好久,我認真了>"< 最後回應你的問題,你要用統計方法來分析你的問題,你要先能夠把你所以的"特性" 轉化成為數值變數才能進行統計分析,而依據你想估計的參數選擇適合的統計方法, 不過我覺得你問的問題實在跟統計風、馬、牛不相關…反正你一開始就說你不懂統計 ,所以也沒什時麼好苛責你… -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.37.140.178

12/31 10:47, , 1F
統計跟統計推論不太一樣唄 統計能作得應該更廣一點......
12/31 10:47, 1F

12/31 16:12, , 2F
我覺得這篇淺顯易懂阿...XD
12/31 16:12, 2F

12/31 22:17, , 3F
你認真了,不過真是篇入門的好文,要推一下
12/31 22:17, 3F

12/31 22:18, , 4F
只是遇到那種打著「我不懂xx,但我覺得xx其實就是..」的人,
12/31 22:18, 4F

12/31 22:18, , 5F
講再多也是白講
12/31 22:18, 5F

12/31 22:23, , 6F
通常..本來就懂你要說啥的也不需要看你寫的
12/31 22:23, 6F

12/31 22:24, , 7F
不懂你要說啥的 看了你的也不會懂(這大概是一年的課)
12/31 22:24, 7F

12/31 22:24, , 8F
寫的很不錯啦  但是先弄清楚你要寫給誰看
12/31 22:24, 8F

12/31 22:59, , 9F
很認真, 值得鼓勵
12/31 22:59, 9F

01/01 11:02, , 10F
例子蠻有趣的XD
01/01 11:02, 10F

01/01 20:36, , 11F
真的認真, 不過我也不覺得不熟統計的人會看得懂你寫的..XD
01/01 20:36, 11F

01/01 21:29, , 12F
原PO認真,1F s大願意說說哪裡不同嗎?
01/01 21:29, 12F
回j大和l大… 其實也不一定阿,我的出發點也不是只有打給開文的人看的… 算是有點拋磚引玉,希望借這篇文讓更多人提出一些自己看法… 說不定其他人對統計有別的見解,我也可以因此受益…謝謝唷!! 關於這兩個例子並不是我自己想出來的,是我的統計老師在上課中舉的例子… 因為我覺得這個例子還不錯,即使修完課好幾年我都還記得…就分享給大家… ※ 編輯: chris006 來自: 114.37.140.178 (01/01 22:25)

01/02 01:55, , 13F
芭樂壞掉的機率為0.1, 一般10%指得是樣本比例.
01/02 01:55, 13F

01/02 01:56, , 14F
你跟原po認真了...
01/02 01:56, 14F

01/02 02:52, , 15F
噗~
01/02 02:52, 15F

01/03 02:28, , 16F
寫的很棒
01/03 02:28, 16F

01/04 00:58, , 17F
認真!給一個推
01/04 00:58, 17F

01/04 15:09, , 18F
推認真的人!!
01/04 15:09, 18F

01/10 01:11, , 19F
我沒學過統計~也看得懂喔~讚!
01/10 01:11, 19F

01/15 00:39, , 20F
型2錯誤(type 2 error):錯誤的接受H1 這個對嗎???
01/15 00:39, 20F

01/02 15:02, 5年前 , 21F
很認真, 值得鼓勵 http://yofuk.com
01/02 15:02, 21F
文章代碼(AID): #1BEyWxlt (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1BEyWxlt (Statistics)