Re: [問題] 回歸分析

看板Statistics作者 (成為有品味的男人)時間20年前 (2006/03/06 17:59), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串4/8 (看更多)
※ 引述《cug ( 比目魚  ￾ )》之銘言: : ※ 引述《scamilla (..)》之銘言: : : 作者: scamilla (..) 看板: Math : : 標題: [統計] 回歸分析 : : 時間: Mon Mar 6 01:29:24 2006 : : 已知一X、Y分布圖,欲以線性迴歸分析其趨勢 : : 1. 若所選取資料數較少時,各筆資料差異性較小,因此相關係數較大, : : 不過也因為所選取資料數佔整體資料數的比例較小,因此利用這些所選取出 : : 來的資料表現線性迴歸的趨勢似乎較不完整。 : 我的想法是 n變小 var要變大的啊 : var變大 那相關係數應該要變小 : 所以無法理解n小時差異較小的想法 想像一下,假設是全校的外貌當母群體 一個學校內一定有超美的校花,也會有相當不太起眼的人 不過大部份還是中間的人,就是長的還不太美,可是也不太醜的人 (假設符合常態的話,別跟我爭說你的學校是右偏) 現在隨機抽出50人成為一個班 班上大部份的人還是普通普通,也有美的,也有不起眼的 但美的一定很難美過校花,醜也很難醜過全校中最不起眼的人 所以變異情形很難大於全校 也有可能校花在那一班裡,不過機率還是低,畢竟中間的人這麼多 n再小一點好了,就兩個人 再抽也很難抽到常態分配的兩端 兩個都是會中間的人,所以變異情形也不會太大 沒什麼理論,只是用一般的言語表達,不知道對不對 例子只是好玩,看不慣的話,可以改成「善良的程度」,結果一樣^^ : : 2. 若所選取資料數較多時,各筆資料差異性較大,因此相關係數較小,不過 : : 也因為所選取資料數佔整體資料數的比例較大,因此利用這些所選取出來 : : 的資料表現線性迴歸的趨勢似乎較資料數較少時完整。 : : 就資料處理的觀念, : “相關係數似乎可以當作是線性迴歸結果正確性與否的指標” : 這句話怪怪的 沒有看過書上說過有這種事情 : 事實上 反而應該是要小心不要以為判定係數可以決定回歸配適的好壞 : : ,若相關係數越高,則代表各筆資料相當符合曲線;而就抽取樣本來 : 上面這句話是在說判定係數越高表示x可以解釋y的能力越高嗎? : 如果不是的話 相關係數越高代表的應該是數據有高度的相關 : 與什麼曲線有關嗎? 沒學過這種事情 : : 說,所抽取樣本的比例越高,越能符合事件所代表的意義,也就是說若把 : : 大部分的資料都列入觀察,那麼所觀察到的也近乎最初的X、Y散佈。 : 就判定係數來說 確實放入的“變數”越多 判定係數只會增加不會減少 : 所以需要調整後的判定係數輔助判斷 : : 以上兩者各有優缺點又互相矛盾,舉極端為例,若取兩筆資料作線性 : : 迴歸,相關係數當然為1,不過所呈現出來的趨勢正確性如何?應該是 : : 低到不可信吧!?若取全部的資料作線性迴歸,所呈現的趨勢不論好 : : 壞,都是完成的呈現這個事件,不過相關係數卻也降低了不少。 : : 請問(1):如何在上述兩項資料處理的作法取得一個平衡?正確的說,如何選 : : 擇資料數的多寡來分析? : : 請問(2):是否有一指數或是相關的理論來分析相關係數的高低與資料數的多 : : 寡間的關係? : : ***不知道我的表達方式好不好或是我所知道的對與否,如果有錯請不吝指教 : : ,希望各位統計高手能幫我解答,感謝! : 恩 不知道我說的是不是對的 不過你講的東西真的怪怪的 : 所以 沒法回答到問題 -- 一對情侶分開 1小時 對女方來說,是漫長的10小時..... 一對情侶相處10小時 對女方來說,是短短的 1小時..... 女人的心很單純 就只是 愛 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.25.118.31
文章代碼(AID): #1430VlXN (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1430VlXN (Statistics)