[問題] 用迴圈整理同個ID的看病次數

看板R_Language作者 (阿龍)時間6年前 (2018/06/09 12:24), 6年前編輯推噓4(4010)
留言14則, 3人參與, 6年前最新討論串1/5 (看更多)
library(COUNT) data(rwm5yr) medical<-rwm5yr https://imgur.com/xLr3I5j
我的目的是像這樣 同個id是同個人 我想要把資料整理成 去計算同個人的 總共 的看病次數 其他的column 就用 同個id最後的 資訊 最後要整理成 id docvis age 1 1 56 2 4 48 3 13 62 請問有套件可以做到這件事情嗎 還是怎麼寫這個迴圈呢 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.114.237.189 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1528518253.A.295.html

06/09 12:51, 6年前 , 1F
medical %>% group_by(id) %>% summarize(docvis=n(), age=
06/09 12:51, 1F

06/09 12:51, 6年前 , 2F
max(age))
06/09 12:51, 2F

06/09 12:52, 6年前 , 3F
dplyr group_by() +pipe 應該是最直覺好讀的方法?
06/09 12:52, 3F

06/09 12:54, 6年前 , 4F
更正 docvis=n () 應該為docvis=sum(docvis)
06/09 12:54, 4F

06/09 13:02, 6年前 , 5F

06/09 13:03, 6年前 , 6F
請問其他變數該怎麼處理有沒有辦法指定
06/09 13:03, 6F
就是可不可以讓medical的[,2:12]都是類似age=max的結果 另外可以讓hhninc 取平均數嗎 謝謝大大 ※ 編輯: ntpuisbest (140.114.237.189), 06/09/2018 13:05:48

06/09 13:07, 6年前 , 7F
summarise_all(funs(last))
06/09 13:07, 7F

06/09 13:08, 6年前 , 8F
可以保留唯一 ID 所有欄的最後一筆資料
06/09 13:08, 8F

06/09 13:11, 6年前 , 9F
平均值就是用 mean(hhninc)
06/09 13:11, 9F

06/09 13:12, 6年前 , 10F
不過 summarise 跟 summarise_all 沒辦法一起使用
06/09 13:12, 10F
那這樣看起來我還是必須要 慢慢打了 因為我的docvis一定要加總才行 ※ 編輯: ntpuisbest (140.114.237.189), 06/09/2018 13:16:39

06/09 13:32, 6年前 , 11F
感謝piggood大大分享,原來summarise_all是這樣用…以前一
06/09 13:32, 11F

06/09 13:32, 6年前 , 12F
直沒搞懂XD
06/09 13:32, 12F

06/09 13:37, 6年前 , 13F
原po可以分別用summarise跟summarise_all做完後再合併……
06/09 13:37, 13F

06/09 13:37, 6年前 , 14F
其他只好等版上大神回應了
06/09 13:37, 14F
文章代碼(AID): #1R6rPjAL (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1R6rPjAL (R_Language)