[問題] panal/longitudinal data 問題

看板Statistics作者 ( )時間10年前 (2015/10/25 17:48), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
如果是跟統計軟體有關請重發文章,使用程式做為分類。 請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。 為避免版面混亂,請勿手動置底問題,擅用E做檔案編輯 大家好, 我有個問題想請教 目前有一個 data set, 是 panal data, 可是他是 unbalanced 的資料 變數有 Quarter, Employee Id, Hospital Visit, Salary, Health Score, 和一些 demograpgics 的資料 我想驗證 Health Score 是否會隨著時間增加而增加, 還有畫一些圖看 Health Score 跟其他變數的關係 請問在畫scatter plot方面, 直接用整個dataset去做會有問題嗎? 還是要分成不同的subset? 雖然我覺得直接用應該可以, 不過還是想詢問大家的意見. 然後在 驗證 Health Score 是否會隨著時間增加而增加, 這方面我不太確定該怎麼做, 因為每個quarter的人數組成都不一樣, 直覺上用普通的 Linear Model (把 quarter 放在解釋變數中) 可能有問題 p.s. 目前單用每quarter的平均值來看, Health Score 隨時間是有增加的. 可以請大家給點意見嗎? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 50.131.13.101 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1445766520.A.B84.html
文章代碼(AID): #1MBALuk4 (Statistics)