[其他] 迴歸變數過多之問題
日前讀到一篇論文探討玫瑰各品種與成交價格的關係
迴歸模型大致如下連結:
http://www.wretch.cc/album/show.php?i=mp11012&b=18&f=1824872842&p=23
我嘗試用[虛擬變數合併順序資訊]之觀念跑這個模型發現
假使以某一個月的數據下去跑
成交日期變數將有30個,而花卉代碼(玫瑰品種)變數也將達30個
造成迴歸變數過多
而以目前學生評估:主成分分析雖然可以解決迴歸變數過多之問題
但似乎不適用這個模型,畢竟模型就是要討論每個品種玫瑰及每天交易的差異
想請問各位大大是否有什麼方法可以解決這個問題?
或者諸如這般的迴歸模型是用什麼樣的觀念下去跑的?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.64.55
→
09/19 17:34, , 1F
09/19 17:34, 1F
→
09/19 17:35, , 2F
09/19 17:35, 2F
※ 編輯: myauo 來自: 140.113.64.55 (09/21 09:49)