Re: [問題] 拆解time-dependent的資料

看板R_Language作者 (偶素米蟲)時間9年前 (2015/04/22 19:28), 編輯推噓3(307)
留言10則, 3人參與, 最新討論串3/3 (看更多)
※ 引述《celestialgod (攸藍)》之銘言: : ※ 引述《yummy7922 (crucify)》之銘言: : : [問題類型]: : : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : : [軟體熟悉度]: : : 請把以下不需要的部份刪除 : : 入門(寫過其他程式,只是對語法不熟悉) : : [問題敘述]: : : 請簡略描述你所要做的事情,或是這個程式的目的 : : 資料是多個人的重複測量資料,每個人的觀察筆數並不相同, : : 其中有一個會變動的變數(ex:用藥資料,某幾次有吃,某些次沒有吃), : : 資料大概是長這樣: : : ID M1 duration IS ID start stop M1 IS : : 1 1 1 0 1 0 1 1 0 : : 1 0 2 0 1 1 4 0 1 : : 1 0 3 0 2 0 3 1 0 : : 1 0 4 1 2 3 5 0 0 : : 2 1 1 0 3 0 1 1 0 : : 2 1 2 0 ---> 3 1 2 0 1 : : 2 1 3 0 : : 2 0 4 0 : : 2 0 5 0 : : 3 1 1 0 : : 3 0 2 1 : : 資料中M1是會變動的變數,is是我的outcome, : : 希望可以轉變成右方的樣子,即,如果有資料變動就做紀錄, : : 就是一般要處理time-dependent survival的樣子, : : 目前只知道sas該怎麼處理,想來請教各位, : : R應該怎麼做轉換,謝謝大家 : I do not know whether there is a function to do this in R, : but I do this by dplyr. : library(data.table) : library(dplyr) : library(magrittr) : dat = data.frame(ID = rep(1:3, c(4, 5, 2)), M1 = c(1,rep(0:1, : each=3),0,0,1,0)) %>% tbl_dt(FALSE) : dat = dat %>% group_by(ID) %>% mutate(duration = 1:length(M1), IS = 0) : dat$IS[c(4, 11)] = 1 : dat %>% group_by(ID) %>% : summarise(stop = cumsum(rle(M1)$lengths), : M1 = rle(M1)$values, : IS = IS[cumsum(rle(M1)$lengths)]) %>% group_by(ID) %>% : mutate(start = c(0, stop[1:(length(stop)-1)])) : ID stop M1 IS start : 1 1 1 1 0 0 : 2 1 4 0 1 1 : 3 2 3 1 0 0 : 4 2 5 0 0 3 : 5 3 1 1 0 0 : 6 3 2 0 1 1 : 補充一點,如果資料量大,請把rle的計算過程獨立成另一個變數,不然算太多次會有點 : 久,這裡只是方便寫法,懶得另立變數。 : 當然只要有group_by 都可以用tapply做,只是比較麻煩就不寫了 不必那麼麻煩, 多生一個start column就可以 start <- tapply(duration, ID, function(x){ c(0, x[-length(x)])}) 多切幾個subinterval其實沒關係 懂得partial likelihood的原理就知道出來的結果是一樣的 老話一句,基本觀念最重要 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.213.28.43 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1429702109.A.E74.html

04/22 20:18, , 1F
哈哈,我根本不知道他要跑什麼,我只是弄成他要的
04/22 20:18, 1F

04/22 20:18, , 2F
樣子。
04/22 20:18, 2F

04/22 20:18, , 3F
謝謝大大補充。
04/22 20:18, 3F

04/22 20:24, , 4F
更正,謝謝大大指導QQ
04/22 20:24, 4F

04/22 20:48, , 5F
現在才發現這裡是R版,不是統計版...歹勢了
04/22 20:48, 5F

04/22 20:50, , 6F
請繼續討論程式寫法 >_<
04/22 20:50, 6F

04/22 22:00, , 7F
大大,統計在這裡也很重要,不走冤枉路才是寫程式
04/22 22:00, 7F

04/22 22:00, , 8F
最好的不二法門。
04/22 22:00, 8F

04/23 12:54, , 9F
謝謝你們,因為還要觀察實際的轉換情形,另外處理
04/23 12:54, 9F

04/23 12:55, , 10F
所以才會想準確的切割,謝謝你們的指教唷!
04/23 12:55, 10F
文章代碼(AID): #1LDuNTvq (R_Language)
文章代碼(AID): #1LDuNTvq (R_Language)