Re: [問題] R的scatter plot
※ 引述《yccjy (生命很美因為你們)》之銘言:
: ※ 引述《yccjy (生命很美因為你們)》之銘言:
: : 請教一下大家
: : R的scatter plot 一個小圓圈是不是不只代表一筆資料呢?
: : 我的資料數是200 用R跑兩個變項的scatterplot
: : 卻只出現35個小圓圈
: : 不知道是我的script寫錯了 還是這是正常現象
: : 可以麻煩各位強者指點一下嗎?
: ed711data <- read.table("C://Documents and Settings/ed711data.dat",header=T)
: scireg<-lm(gpa~Ef) #produces simple linear model
: plot(Ef,gpa) # provides scatterplot
: 這是我打的指令
: 應該只有最後一行跟scatterplot有關係吧?
: 不知道問題出在哪裡
: 先感謝願意指教的強者喔!
抱歉之前的資料敘述不夠清楚
兩個變項分別是Ef(努力程度,由某量表得到的分數)
以及GPA(學業平均成績)
想看Ef是不是可以預測學業成績
之前的指令 為了節省版面 把一些東西刪掉了
以下是完整指令
ed711data <- read.table("C://Documents and Settings/ed711data.dat",header=T)
summary(ed711data) # provides summary statistics
cor(ed711data) # provides correlation matrix
attach(ed711data) # Generally a good idea to add this line
scireg<-lm(gpa~Ef) #produces simple linear model
plot(Ef,gpa) # provides scatterplot
abline(Ef,gpa) # Adds the estimated regression line
不過我大概知道為什麼跑出來的點只有幾十個了
應該是因為資料性質根本不適合用這個圖呈現:
這裡的兩個變項都是discrete variable
(GPA通常是連續變項 但是這邊的GPA被轉化成非連續變項)
兩個變項的排列組合 總共只有45個可能
所以我想 應該是因為有很多資料完全重疊了 所以從圖上看到的點遠小於資料數(200)
如果這個想法有錯 還請大家指證
沒有錯的話 雖然是自己犯的很初階的錯誤 還是留在板上
希望如果有跟我一樣的初學者也遇到一樣的問題 可以有個參考
抱歉佔用大家的版面 感謝大家的指教
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 24.196.80.18
※ 編輯: yccjy 來自: 24.196.80.18 (10/04 10:07)
→
10/05 17:35, , 1F
10/05 17:35, 1F
→
10/06 05:18, , 2F
10/06 05:18, 2F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 3 篇):