[問題] 集群分析距離方法請較

看板Statistics作者 (大頭)時間11年前 (2014/12/30 21:34), 11年前編輯推噓0(003)
留言3則, 3人參與, 最新討論串1/1
[軟體程式類別]:R [程式問題]:集群分析的距離方法設定 [軟體熟悉度]:低(1個月) [目的]: 因為資料的關係,我目前需要不同的距離方法做為集群分析的條件 例如: 樣本1向量 c(1,-1,1,-1,-1) 樣本2向量 c(-1,1,1,1,-1) 各維度變數只有(1,-1) 兩種 我希望此兩向量的距離為 4(除了中間兩者第三組變數都為1不考慮外,其他組(-1,-1), (1,-1), (-1,1)的總情形個數(共四組),想以此為距離方法來分群,請問有辦法做到嗎? 此外,我嘗試先算出此份資料的相對距離來解決上者問題 資料與相對距離的資料 yelp<-read.csv("yelp.csv", header=F, sep=",") yelpM<-read.csv("yelpM.csv", header=F, sep=",") yelp.fit<-hclust(yelpM, method="ward.D") 執行到最後一行,卻發生錯誤訊息如下: 錯誤在if (is.na(n) || n > 65536L) stop("size cannot be NA nor exceed 65536") : 需要 TRUE/FALSE 值的地方有缺值 請問在距離資料這部分需要怎樣的形式才能執行成功呢~感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.189.5 ※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1419946451.A.E5D.html ※ 編輯: caster1985 (114.32.189.5), 12/30/2014 21:38:22

12/30 23:26, , 1F
邏輯怪。樣本1和自己相比的距離豈就3?
12/30 23:26, 1F

12/31 01:00, , 2F
對喔,感謝樓上的提醒~~
12/31 01:00, 2F

01/04 21:43, , 3F
可以去看線性代數有各種距離的定義
01/04 21:43, 3F
文章代碼(AID): #1KegdJvT (Statistics)