[問題] 請問不連續的data該如何處理?
其實我的問題沒有那麼簡單
最近剛好把生統學完了
然後在做總整理的時候
發現這個問題
-------------------------------------------------------------
幾乎所有的檢定方法都需要 連續data
只有少數一些無母數且rank的檢定 才能接受 不連續的data
-------------------------------------------------------------
我所學過的 Population distribution 只有
1.Binomial (不連續)
2.Poisson (不連續)
3.Normal
-----以下是我最後整理的觀念敘述 希望大大門幫我檢查一下是不是正確的-----
不連續data 的 Population distribution 和 sample distribution
大部分是 Binomial distribution
且 P=0.5 (無明顯之左偏或右偏)
與連續data中 normal distribution 的 pdf分佈圖形很類似
Binomial distribution 是屬於 catagorical data 且 k=2
但不連續的data在 "直覺上" 全部都屬於 同一個 catagory (k=1)
所以必須假定第二個catagory是存在的
於是乎必須區分成 (True) v.s. (False)
真實存在的不連續data 全部歸類在 True catagory
False 為無法解釋的 catagory (我在想會不會是空集合)
然後把 Binomial distrbution 進行 Normal approximation
轉換成連續的 data
就可以用連續前提的檢定去處理了...
------------------------------------------------------------
這樣定義到底對不對阿?
而且這樣的觀念轉了一回
好像最後的結果就是不連續的 data 可以直接當成 連續的data來用
-------------------------------------------------------------
Binomial 之於 不連續的data
Normal 之於 連續的data
這樣放在一起是正確的嗎?
-------------------------------------------------------------
真的是跪求各位學過數理統計的大大幫忙了
生統的觀念真的很缺很缺....
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.231.244.238
※ 編輯: gsuper 來自: 61.231.244.238 (06/27 22:10)
※ 編輯: gsuper 來自: 61.231.244.238 (06/27 22:25)
推
06/27 23:04, , 1F
06/27 23:04, 1F
→
06/28 02:09, , 2F
06/28 02:09, 2F
→
06/28 18:37, , 3F
06/28 18:37, 3F