[問題] 類別資料編碼問題
大大,您好:
有個問題想請教我的資料想依據下列來分編碼
例如: 依學院分:理學院、工學院、商學院、教育學院
依科系分:數學系、非數學系,且分數學系底下又要分:與數學相關、與數學非相關
依學歷分:學士、碩士
1.我是否要將每個類別都用虛擬變數來編碼
例如: 理 工 商 教育
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 0
碩士 學士
1 0
0 0
那在輸入資料時理學院的就要輸入 1,0,0,0 對嗎?
2.如上述依科系分那要怎麼編碼,因為有2個階層?
3.如果這三類都用虛擬變數來編碼,是否可以探討彼此間的關係?
例如: 一開始要研究哪個學院表現比較好,
後來再加入一因子,理學院且數學系表現比較好還是理學院非數學系表現比較好
要如何編碼才能清楚且明瞭探討這些類別資料的關係呢?
謝謝
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.122.140.126
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):