Re: [問題] R的scatter plot

看板Statistics作者 (生命很美因為你們)時間17年前 (2008/10/04 10:03), 編輯推噓0(002)
留言2則, 2人參與, 最新討論串3/3 (看更多)
※ 引述《yccjy (生命很美因為你們)》之銘言: : ※ 引述《yccjy (生命很美因為你們)》之銘言: : : 請教一下大家 : : R的scatter plot 一個小圓圈是不是不只代表一筆資料呢? : : 我的資料數是200 用R跑兩個變項的scatterplot : : 卻只出現35個小圓圈 : : 不知道是我的script寫錯了 還是這是正常現象 : : 可以麻煩各位強者指點一下嗎? : ed711data <- read.table("C://Documents and Settings/ed711data.dat",header=T) : scireg<-lm(gpa~Ef) #produces simple linear model : plot(Ef,gpa) # provides scatterplot : 這是我打的指令 : 應該只有最後一行跟scatterplot有關係吧? : 不知道問題出在哪裡 : 先感謝願意指教的強者喔! 抱歉之前的資料敘述不夠清楚 兩個變項分別是Ef(努力程度,由某量表得到的分數) 以及GPA(學業平均成績) 想看Ef是不是可以預測學業成績 之前的指令 為了節省版面 把一些東西刪掉了 以下是完整指令 ed711data <- read.table("C://Documents and Settings/ed711data.dat",header=T) summary(ed711data) # provides summary statistics cor(ed711data) # provides correlation matrix attach(ed711data) # Generally a good idea to add this line scireg<-lm(gpa~Ef) #produces simple linear model plot(Ef,gpa) # provides scatterplot abline(Ef,gpa) # Adds the estimated regression line 不過我大概知道為什麼跑出來的點只有幾十個了 應該是因為資料性質根本不適合用這個圖呈現: 這裡的兩個變項都是discrete variable (GPA通常是連續變項 但是這邊的GPA被轉化成非連續變項) 兩個變項的排列組合 總共只有45個可能 所以我想 應該是因為有很多資料完全重疊了 所以從圖上看到的點遠小於資料數(200) 如果這個想法有錯 還請大家指證 沒有錯的話 雖然是自己犯的很初階的錯誤 還是留在板上 希望如果有跟我一樣的初學者也遇到一樣的問題 可以有個參考 抱歉佔用大家的版面 感謝大家的指教 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 24.196.80.18 ※ 編輯: yccjy 來自: 24.196.80.18 (10/04 10:07)

10/05 17:35, , 1F
恩...這樣就可以跑了 你說的應該是對的
10/05 17:35, 1F

10/06 05:18, , 2F
感謝樓上的幫忙!
10/06 05:18, 2F
文章代碼(AID): #18vixKn1 (Statistics)
討論串 (同標題文章)
文章代碼(AID): #18vixKn1 (Statistics)