[討論] 資料分布

看板MATLAB作者時間12年前 (2013/11/14 14:30), 編輯推噓3(307)
留言10則, 3人參與, 最新討論串1/1
假設有兩筆資料 根據這兩筆資料畫出scatter diagram後 會有一塊明顯集中的區域以及其他比較鬆散的區域 若是想要只取集中的區域內的data做分析,捨去鬆散的區域的data 這個作法是有什麼相關的理論嗎? 在matlab上面該如何執行 感激不盡!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.19.237

11/14 15:55, , 1F
kmeans
11/14 15:55, 1F

11/14 17:27, , 2F
樓上 請問跑kmeans他會自己找出最密集的區塊嗎 還是有手動
11/14 17:27, 2F

11/14 17:28, , 3F
輸入呢?
11/14 17:28, 3F

11/14 17:40, , 4F
kmeans 是 greedy alg. 原po只能多跑幾輪 kmeans
11/14 17:40, 4F

11/14 17:50, , 5F
可是我只是要找出一個cluster就好,就是找資料內最密集的
11/14 17:50, 5F

11/14 17:50, , 6F
區域,其餘的都捨去掉
11/14 17:50, 6F

11/14 17:53, , 7F
當資料間沒有明顯的區隔時,要如何把較為散開的點給去除?
11/14 17:53, 7F

11/14 17:54, , 8F
若對資料的 distribution 不是很了解
11/14 17:54, 8F

11/14 17:55, , 9F
我是覺得可以用 mean-shift 來求得
11/14 17:55, 9F

11/14 17:56, , 10F
而稀疏區域排除,得看你所選取的 ROI 大小為何才能決定
11/14 17:56, 10F
文章代碼(AID): #1IX6tmIh (MATLAB)