Re: 統計方法學幾呼成為神學的代名詞了，當代顯學。

看板Statistics作者chris006 (= =")時間14年前 (2009/12/31 05:38)推噓10(10推 0噓 11→)

留言21則, 15人參與討論串5/5 (看更多)

※ 引述《citymale (炒股救地球)》之銘言： : 想舉個例子和wush大大和liton大大說明一下好了。 : 假設現在有一群人，把他們分成兩邊。 : 一邊當出題者，一邊當應試者，兩方互不見面。 : 出題者有很多人，出來的題目不是只有單一特性，而是綜合所有出題者的想法。 : 應試者所能得到的訊息就是題目，而不知出題者有多少人。 : 應試者跟據題目，要去猜出題者的個性了，他要用何種方法呢？ : 1.歸類。這個方法可能有效，但如果某個題目是包含很多特性，可能就難以歸類了。 : 2.統計。根據1所做出來的結果，去做機率的統計。 : 也許應試者最後找出出題者的綜合特性了。 : 但這時出題者公佈答案了，他是把題目剪成一張一張的小紙片，然後用 : 電風扇去吹，選取比較遠的紙片。 : 那… 呃… 我想原po真的不了解統計在做什麼，我就用淺白的話告訴你(各位有錯請指正) 首先用一句話來說明統計推論==>"利用機率的敘述來量化抽樣誤差的大小" 用養豬場的例子：假設養豬場共有一萬頭豬… 今天我們有興趣的是母體的參數===>豬隻的平均體重，最簡單的方法就是一隻一隻豬去量(普查)，但是這個方法很浪費時間(如果不只五萬頭呢…)，所以就隨機選了十隻量體重(抽樣)，那量出了十個體重有十個數字，你會用哪個數字去猜豬隻的平均體重呢 ?? 就算沒學過統計的人，直覺應該也會把十個數字除以十算得一個平均，將算出來的平均去猜豬隻的平均體重，當然可能猜的中、可能猜不中，人們的認知裡應該是不會猜中，運氣會有這麼好嗎… 當然猜不中我們會想知道跟真正的平均體重到底距離多遠(誤差)，如果我告訴你算出來的體重和真正的平均體重差距10kg的機率大於95％，那你覺得這句話是不是有意義多了，我的直覺認為猜的還蠻準的… 因為母體太大沒辦法普查，所以必需抽樣，但是抽樣會有誤差稱抽樣誤差，所以必需用機率的敘述來量化抽樣誤差的大小… 為什麼我們會想知道養豬場的平均體重呢…假設今天養豬場的老闆跟你說：我的養豬場裡的豬全部五千萬賣你，平均一頭豬五千塊，那你查了一下知道市價一頭250公斤的豬可以賣到五千塊，那麼老闆跟你說他養的豬平均一定超過250公斤，所以他的豬可以買，當然你一定會懷疑老闆講的話是真是假，這時老闆就說了：那不然這樣子好了，讓你到豬舍裡面抓50頭豬量牠們的體重，結果算出來的平均體重真的超過250公斤，那你可能就傾向相信老問說的話… 而至於要不要購買就是決策，樣本資訊是影響決策依據，當然依據樣本資訊所做的決策不一定正確，如果今天抓到的50隻剛好是養豬場裡前50重的豬(極端的情況)，皆已超出正常體重很多了(多不多要用標準差來衡量)，必然會做購買的決策，但是其它的九千多隻都比250公斤輕很多，必然全部的平均體重就小於250公斤=>虧錢，所以統計是在幫助我們在有限的資訊下去進行決策，然而依據樣本做出決策對於否我們並不會知道，但是我們可以控制犯型一錯誤發生的機率很小… 統計方法：我沒修過專門的統計方法，是不是這樣分就不確定了… PART1-估計：利用樣本資訊直接進行推論點估計：利用統計量進行估計區間估計：利用隨機區間進行估計 PART2-假設檢定：假設：對母體未知參數所作的敘述或描述－按照立場的不同分成虛無假設(H0)、對立假設(H1) 檢定：樣本空間的分割，分割接受域和棄卻域有母數統計學：－有分配假設下的統計推論－常態母體下的統計推論、Bernoulli母體下的統計推論無母數統計學：－所以有過程未涉及參數或分配的設定－雖有分配或參數的設定，但其檢定統計量在虛無假設下的分配與其設定無關其中變異數分析、回歸分析都是在做假設檢定…應該說本質都是一樣的，只是推論的對象不一樣，就是有興趣的參數不一樣，就因為有興趣的參數不一樣，所以統計推論的方法不一樣，所以總稱統計方法吧… 還有你應該要知道的幾個名詞… 型1錯誤(type 1 error)：錯誤的棄卻H0 型2錯誤(type 2 error)：錯誤的接受H1 alpha風險：犯型1錯誤的機率 beta風險：犯型2錯誤的機率例子二：買芭樂(不喜歡芭樂可以換香蕉...誤) 假設一箱芭樂共有100顆，裡面有幾顆是壞掉的不知道，壞掉的機率是10% 老闆說一箱裡面可以讓你拿10顆出來檢查… 虛無假設H0：壞掉的機率是10% 對立假設H1：壞掉的機率是超過10% =>預期一箱芭樂裡面會有10顆壞掉的，壞掉的芭樂超過10顆你就不會買… =>如果拿出的10顆裡面越多顆壞掉的就傾向於不會買… <case1>：10顆裡面都是好的=>傾向於會買 <case1-1>：結果箱子裡面有15顆壞掉，只是剛好都沒被選到錯誤決策==>以上犯了型2錯誤 <case1-2>：結果箱子裡面只有5顆壞掉正確決策 <case2>：10顆裡面10顆都是壞的=>傾向於不會買 <case2-1>：結果箱子裡有十顆壞掉的，剛好都被選到錯誤決策==>以上犯了型1錯誤 <case2-2>：結果箱子裡面有20顆壞掉的正確決策一個優良的檢定是在固定alpha風險下，尋求一個檢定具有較小的beta風險=>重alpha (兩者風險的關係請你有興趣再翻一下統計課本) 重alpha則當alpha越小時(棄卻域越小、顯著水準越高)，較不易拒絕H0=>H0為被保護立場(欲否定立場)，即為無足夠證據時不易使得H1成立… 註：顯著水準=1-alpha 呼，打了好久，我認真了>"< 最後回應你的問題，你要用統計方法來分析你的問題，你要先能夠把你所以的"特性" 轉化成為數值變數才能進行統計分析，而依據你想估計的參數選擇適合的統計方法，不過我覺得你問的問題實在跟統計風、馬、牛不相關…反正你一開始就說你不懂統計，所以也沒什時麼好苛責你… -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.37.140.178

→

sgazn

12/31 10:47, , 1^F

12/31 10:47, 1^F

→

Chsieh

12/31 16:12, , 2^F

12/31 16:12, 2^F

推

jwjeng

12/31 22:17, , 3^F

12/31 22:17, 3^F

→

jwjeng

12/31 22:18, , 4^F

12/31 22:18, 4^F

→

jwjeng

12/31 22:18, , 5^F

12/31 22:18, 5^F

→

liton

12/31 22:23, , 6^F

12/31 22:23, 6^F

→

liton

12/31 22:24, , 7^F

12/31 22:24, 7^F

→

liton

12/31 22:24, , 8^F

12/31 22:24, 8^F

推

bmka

12/31 22:59, , 9^F

12/31 22:59, 9^F

推

wlsherica

01/01 11:02, , 10^F

01/01 11:02, 10^F

推

ILSYC

01/01 20:36, , 11^F

01/01 20:36, 11^F

推

kimutaka

01/01 21:29, , 12^F

01/01 21:29, 12^F

回j大和l大… 其實也不一定阿，我的出發點也不是只有打給開文的人看的… 算是有點拋磚引玉，希望借這篇文讓更多人提出一些自己看法… 說不定其他人對統計有別的見解，我也可以因此受益…謝謝唷!! 關於這兩個例子並不是我自己想出來的，是我的統計老師在上課中舉的例子… 因為我覺得這個例子還不錯，即使修完課好幾年我都還記得…就分享給大家… ※ 編輯: chris006 來自: 114.37.140.178 (01/01 22:25)

推

clickhere

01/02 01:55, , 13^F

01/02 01:55, 13^F

→

clickhere

01/02 01:56, , 14^F

01/02 01:56, 14^F

推

liton

01/02 02:52, , 15^F

01/02 02:52, 15^F