[問題] 問卷調查: 求取變數(多變量)間covariance之資料來源
看板Statistics作者pingupingu (OOOOOOOOOOOOOOOOOOOOOOO)時間16年前 (2009/09/15 16:29)推噓0(0推 0噓 0→)留言0則, 0人參與討論串1/1
小弟有一筆統計資料
是100個受測者對16台車 以14個形容詞項目做評分
要分析的對象是那14個形容詞的因素或主成份
因此為重要的資料是那14個形容詞的Covariance矩陣(或是Correlation)
因為有16臺車100個人
要產生這個矩陣的原始資料應該是長怎樣呢?
(1)是要用全部人 100*16臺車對一形容詞的資料來算 (n*p=1600*14 n個資料p個變數)
形容詞1 形容詞2 ... 形容詞14
車1 人1 X X X ... X
人2 X X X ... X
: : : : : :
人100 X X X ... X
車2 人1 X X X ... X
人2 X X X ... X
: : : : : :
人100 X X X ... X
車16 人1 X X X ... X
: : : : : :
人100 X X X ... X(1600,14)
(2) 還是用16臺車每臺得到的平均分數來算 (n*p=16*14)?
形容詞1 形容詞2 ... 形容詞14
車1平均100人分數 X X ... X
車2平均100人分數 X X ... X
: : : :
車16平均100人分數 X X ... X
感覺好像對單一臺車時,形容詞對多個人的資料(100n*14p)間才是多元常態??
那把所有資料都列出(1600n*14p)那1600個向量是會多元常態嗎?
第一個方法對一形容詞來說資料量最多,如果做因素分析或主成份
*可以解釋為「人類對一堆車的看法 有多少背後因素」
但文獻看到好似都是用第二個方法
他應該是假設車對形容詞是多元常態?
那這樣等於只有16個獨立向量,要去做14變數的多變量分析
似乎是不夠讓形容詞做因素或主成份分析?
*但這樣的結果可以解釋為「有多少背後因素足夠解釋這16台車」
但如果對僅一臺車來說,14個形容詞有100人次的觀測且每個觀測向量是獨立又多元常態\
,可以輕易做因素分析。
*但這樣的結果是「人類對某一臺車的形容詞 有背後幾種主要因素就夠解釋這臺車」
僅以一臺車的資料而已
到底要怎麼做才是較正確的呢??
而我如果是要探究「人類對車的形容詞可能有幾種因素」而不是「有哪些主要形容詞背後\
因素足夠解釋這16臺車」
感覺是要用第一種方法 (人對一堆車的觀感的背候因素)?
但文獻好像都用第二種
不曉得我得解讀是否正確?
我可以使用第一種來做嗎?
另外 雖然我的問卷每個答案都是李克特5點尺度,不用標準化不同形容詞間的量級
但是不是用correlation矩陣會比covariance矩陣來算主成份或因素會好點??
問題有點繁雜,真是不好意思!
感謝各位大大閱讀!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.15.147