Re: [問題] 資料分析
※ 引述《tigerrex (shun)》之銘言:
: 因為不知道該用什麼方法來找出
: 所請求板上的大大指點迷津一番 orz
: ---------------------------------------------
: 資料是三維空間的函數(向量) N=(x, y, z)
: 在一個正方形區域裡 隨機抽樣一萬五千筆資料
: 已知資料可以區分為兩種
這裡的資料是指母體所有的資料還是隨機抽樣的一萬五千筆?
: 一種為(x,y,z)相同 佔A%
這裡的相同是指完完全全的相同還是指在(x,y,z)附近的點?
: 另一種為(x1,y1,z1)跟(x,y,z)有些微差距 佔B%
如果前一個問題的答案是在(x,y,z)附近
那這裡要問 些微是多些微?
明顯的可以區分或是會有混在一起的情況?
: 其中 A% > B%
: 請問我要怎麼有效且快速的找出(x,y,z)以及 A、B值
你的問題給的訊息不夠明確 所以很難回答
如果兩群可以明顯區分
1.資料完完全全落在那兩個點上
那就亂抽抽到兩個不一樣的就解決了
2.在兩點附近
亂抽抽出兩群個別平均就行了
如果不能明顯區分
那就要先找出一個分類標準說哪一個資料點屬於哪一群 這個問題就有點大了
假設資料區分都沒問題了
A跟B的值就抽出足夠數量的樣本去估計p就行了
這個問題比較簡單
口語上的一些模糊的說法容易造成統計分析上的困擾
所以 盡量把問題寫清楚先
最好能附上一些數據樣本或是例子大家比較好進入你的問題
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.40.59
討論串 (同標題文章)