[問題] 請問複選題可以跑群聚分析嗎?
各位高手好,
小弟手邊有一筆複選題的資料,
例題如下:
1. 請問您週末會進行哪些休閒活動?
□運動 □看書 □玩電腦 □唱歌 □看電視 □園藝...
類似的題目有十題以上,每題選項不一定相同。
我對每一題分別進行階層性群聚分析(hierarchical cluster analysis),
也就是說以下討論都是對單個題目,不同選項之間的討論,
並沒有涉及不同題目之間的群聚分析。
我使用Eucidian Sqaured Distance計算選項之間的距離。
我不是計算樣本,而是計算選項之間的距離,是因為尚未釐清變項間的關聯。
問題如下:
1. 請問cluster analysis如何計算非categorical變項之間的「距離」?
我看了網路上寫的距離計算公式,但不清楚如何計算Xij-Yij。
2. 請問如何解釋變項之間的距離?是不是:
有勾選A變項的資料點的「某個值」的平均值以及
有勾選B變項的資料點的「某個值」的平均值之間的距離?
我「某個值」的意思是因為我不太清楚複選題(categorical data)要如何算距離,
或是距離的平均值。
拜託各位了,謝謝各位!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.218.221.17
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1442894835.A.78A.html
→
09/28 01:16, , 1F
09/28 01:16, 1F
→
09/28 01:17, , 2F
09/28 01:17, 2F