Re: [問題] 資料分析

看板Statistics作者 (焦了六年變脆了)時間16年前 (2009/10/27 16:55), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串3/8 (看更多)
※ 引述《tigerrex (shun)》之銘言: : 因為不知道該用什麼方法來找出 : 所請求板上的大大指點迷津一番 orz : --------------------------------------------- : 資料是三維空間的函數(向量) N=(x, y, z) : 在一個正方形區域裡 隨機抽樣一萬五千筆資料 : 已知資料可以區分為兩種 這裡的資料是指母體所有的資料還是隨機抽樣的一萬五千筆? : 一種為(x,y,z)相同 佔A% 這裡的相同是指完完全全的相同還是指在(x,y,z)附近的點? : 另一種為(x1,y1,z1)跟(x,y,z)有些微差距 佔B% 如果前一個問題的答案是在(x,y,z)附近 那這裡要問 些微是多些微? 明顯的可以區分或是會有混在一起的情況? : 其中 A% > B% : 請問我要怎麼有效且快速的找出(x,y,z)以及 A、B值 你的問題給的訊息不夠明確 所以很難回答 如果兩群可以明顯區分 1.資料完完全全落在那兩個點上 那就亂抽抽到兩個不一樣的就解決了 2.在兩點附近 亂抽抽出兩群個別平均就行了 如果不能明顯區分 那就要先找出一個分類標準說哪一個資料點屬於哪一群 這個問題就有點大了 假設資料區分都沒問題了 A跟B的值就抽出足夠數量的樣本去估計p就行了 這個問題比較簡單 口語上的一些模糊的說法容易造成統計分析上的困擾 所以 盡量把問題寫清楚先 最好能附上一些數據樣本或是例子大家比較好進入你的問題 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.109.40.59
文章代碼(AID): #1AvhLokX (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1AvhLokX (Statistics)