[問題] 請問複選題可以跑群聚分析嗎?

看板Statistics作者 (Pseudo-romantic)時間10年前 (2015/09/22 12:07), 編輯推噓0(002)
留言2則, 1人參與, 最新討論串1/1
各位高手好, 小弟手邊有一筆複選題的資料, 例題如下: 1. 請問您週末會進行哪些休閒活動? □運動 □看書 □玩電腦 □唱歌 □看電視 □園藝... 類似的題目有十題以上,每題選項不一定相同。 我對每一題分別進行階層性群聚分析(hierarchical cluster analysis), 也就是說以下討論都是對單個題目,不同選項之間的討論, 並沒有涉及不同題目之間的群聚分析。 我使用Eucidian Sqaured Distance計算選項之間的距離。 我不是計算樣本,而是計算選項之間的距離,是因為尚未釐清變項間的關聯。 問題如下: 1. 請問cluster analysis如何計算非categorical變項之間的「距離」? 我看了網路上寫的距離計算公式,但不清楚如何計算Xij-Yij。 2. 請問如何解釋變項之間的距離?是不是: 有勾選A變項的資料點的「某個值」的平均值以及 有勾選B變項的資料點的「某個值」的平均值之間的距離? 我「某個值」的意思是因為我不太清楚複選題(categorical data)要如何算距離, 或是距離的平均值。 拜託各位了,謝謝各位! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.218.221.17 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1442894835.A.78A.html

09/28 01:16, , 1F
每個選項視為binary vector
09/28 01:16, 1F

09/28 01:17, , 2F
1代表受試者有選 0代表沒選 這樣算Euclidean distanc
09/28 01:17, 2F
文章代碼(AID): #1M0DFpUA (Statistics)