[問題] 集群分析距離方法請較
[軟體程式類別]:R
[程式問題]:集群分析的距離方法設定
[軟體熟悉度]:低(1個月)
[目的]:
因為資料的關係,我目前需要不同的距離方法做為集群分析的條件
例如:
樣本1向量
c(1,-1,1,-1,-1)
樣本2向量
c(-1,1,1,1,-1)
各維度變數只有(1,-1) 兩種
我希望此兩向量的距離為 4(除了中間兩者第三組變數都為1不考慮外,其他組(-1,-1),
(1,-1), (-1,1)的總情形個數(共四組),想以此為距離方法來分群,請問有辦法做到嗎?
此外,我嘗試先算出此份資料的相對距離來解決上者問題
資料與相對距離的資料
yelp<-read.csv("yelp.csv", header=F, sep=",")
yelpM<-read.csv("yelpM.csv", header=F, sep=",")
yelp.fit<-hclust(yelpM, method="ward.D")
執行到最後一行,卻發生錯誤訊息如下:
錯誤在if (is.na(n) || n > 65536L) stop("size cannot be NA nor exceed 65536")
: 需要 TRUE/FALSE 值的地方有缺值
請問在距離資料這部分需要怎樣的形式才能執行成功呢~感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.189.5
※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1419946451.A.E5D.html
※ 編輯: caster1985 (114.32.189.5), 12/30/2014 21:38:22
→
12/30 23:26, , 1F
12/30 23:26, 1F
→
12/31 01:00, , 2F
12/31 01:00, 2F
→
01/04 21:43, , 3F
01/04 21:43, 3F