[討論] 關於Hierarchical cluster analysis

看板Statistics作者 (奈米罩杯)時間15年前 (2010/10/28 15:33), 編輯推噓0(0016)
留言16則, 3人參與, 最新討論串1/1
最近在看一篇PAPER "Colorimetric Sensor Array for Determination and Identification of Toxic Industrial Chemicals" 是化學化工相關的文章 其中有個部分用到叫HCA(Hierarchical cluster analysis) 上網查了一些資料好像是統計方法的一種 不過因為不是專業的 所以看了老半天還是看不懂意思QQ 提供一張裡面的圖: http://0rz.tw/Wpnm6 希望有懂這個方法高手簡述一下這個方法在做什麼 還有這個圖代表什麼意思... 還有橫坐標的squared Euclidean Distanse/1000是什麼意思... 萬分感謝!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.55.113

10/28 15:58, , 1F
你有 21 個族群 , 假設是 rows , 再來你有量化的特徵 ,
10/28 15:58, 1F

10/28 15:59, , 2F
假設是 columns , 歐式距離的定義去查 wiki
10/28 15:59, 2F

10/28 15:59, , 3F
任意選兩個 rows , 都可以產生一個歐是距離
10/28 15:59, 3F

10/28 16:00, , 4F
最後利用這個距離將 21 個族群分類 , Hierarchical 的做法
10/28 16:00, 4F

10/28 16:01, , 5F
是一直對半切
10/28 16:01, 5F

10/28 16:02, , 6F
除那個 1000 對分類這件事情是沒意義的 , 可能要拿來當某個
10/28 16:02, 6F

10/28 16:03, , 7F
解釋變數吧
10/28 16:03, 7F

10/28 16:04, , 8F
或許你可以去生物資訊版問問看
10/28 16:04, 8F

10/28 16:05, , 9F
嗯~~謝謝你...我是不大懂這樣的圖是程式跑出來的還是?
10/28 16:05, 9F

10/28 16:05, , 10F
還有這張圖代表的結論?
10/28 16:05, 10F

10/28 16:27, , 11F
階層式集群分析. 依某種方式定義原個體間的距離, 再依某種方
10/28 16:27, 11F

10/28 16:29, , 12F
式定義個體與集群間、兩集群間之距離, 然後把距離最接近的個
10/28 16:29, 12F

10/28 16:30, , 13F
體或集群併成一個集群. 輸出結果是分群的樹狀圖, 在不同距離
10/28 16:30, 13F

10/28 16:31, , 14F
水準下可得不同集群數. 不管最後選取的距離水準、集群數如何
10/28 16:31, 14F

10/28 16:32, , 15F
同一集群內的個體被認為是彼此間比較相似, 而不同集群的個體
10/28 16:32, 15F

10/28 16:32, , 16F
是比較不相似的.
10/28 16:32, 16F
文章代碼(AID): #1CoIT1KK (Statistics)