[問題] 回歸分析

看板Statistics作者 (..)時間20年前 (2006/03/06 01:35), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/8 (看更多)
※ [本文轉錄自 Math 看板] 作者: scamilla (..) 看板: Math 標題: [統計] 回歸分析 時間: Mon Mar 6 01:29:24 2006 已知一X、Y分布圖,欲以線性迴歸分析其趨勢 1. 若所選取資料數較少時,各筆資料差異性較小,因此相關係數較大, 不過也因為所選取資料數佔整體資料數的比例較小,因此利用這些所選取出 來的資料表現線性迴歸的趨勢似乎較不完整。 2. 若所選取資料數較多時,各筆資料差異性較大,因此相關係數較小,不過 也因為所選取資料數佔整體資料數的比例較大,因此利用這些所選取出來 的資料表現線性迴歸的趨勢似乎較資料數較少時完整。 就資料處理的觀念,相關係數似乎可以當作是線性迴歸結果正確性與否的 指標,若相關係數越高,則代表各筆資料相當符合曲線;而就抽取樣本來 說,所抽取樣本的比例越高,越能符合事件所代表的意義,也就是說若把 大部分的資料都列入觀察,那麼所觀察到的也近乎最初的X、Y散佈。 以上兩者各有優缺點又互相矛盾,舉極端為例,若取兩筆資料作線性 迴歸,相關係數當然為1,不過所呈現出來的趨勢正確性如何?應該是 低到不可信吧!?若取全部的資料作線性迴歸,所呈現的趨勢不論好 壞,都是完成的呈現這個事件,不過相關係數卻也降低了不少。 請問(1):如何在上述兩項資料處理的作法取得一個平衡?正確的說,如何選 擇資料數的多寡來分析? 請問(2):是否有一指數或是相關的理論來分析相關係數的高低與資料數的多 寡間的關係? ***不知道我的表達方式好不好或是我所知道的對與否,如果有錯請不吝指教 ,希望各位統計高手能幫我解答,感謝! -- 「暗戀的幸福,是你正為著對方做任何事,而他卻不清楚, 此時你心中的甜與苦」 「猜測著自己喜歡的人的心思,是累.是痛.是苦.也是幸福」 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.171.142.105 -- 「暗戀的幸福,是你正為著對方做任何事,而他卻不清楚, 此時你心中的甜與苦」 「猜測著自己喜歡的人的心思,是累.是痛.是苦.也是幸福」 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.171.142.105
文章代碼(AID): #142o5Vmp (Statistics)
討論串 (同標題文章)
文章代碼(AID): #142o5Vmp (Statistics)