Re: [問題] 去除重複值
※ 引述《tHEiPHoNe ( )》之銘言:
: 請問有一組資料
: 紀錄user點擊item紀錄
: 同一個user想踢除相鄰的重複值
: 如下
: id click
: 1 a
: 1 a ->重複
: 1 b
: 1 a
: 1 c
: 1 c ->重複
: 1 a
: 1 a ->重複
: 1 b
: 1 b ->重複
: 1 b ->重複
: 1 a
: 2 a
: 2 a ->重複
: 2 b
: 2 c
: 2 a
: 2 b
: 2 c
: 請問該如何處理呢?
: 謝謝
好讀版:http://pastebin.com/tC7U6MqT
library(data.table)
library(magrittr)
DT <- fread('
id click
1 a
1 a
1 b
1 a
1 c
1 c
1 a
1 a
1 b
1 b
1 b
1 a
2 a
2 a
2 b
2 c
2 a
2 b
2 c')
indx <- DT %$% paste0(id, click) %>% rle %$%
cumsum(c(1, lengths)) %>% .[1:(length(.)-1)]
DT[indx, ]
# id click
# 1: 1 a
# 2: 1 b
# 3: 1 a
# 4: 1 c
# 5: 1 a
# 6: 1 b
# 7: 1 a
# 8: 2 a
# 9: 2 b
# 10: 2 c
# 11: 2 a
# 12: 2 b
# 13: 2 c
--
R資料整理套件系列文:
magrittr #1LhSWhpH (R_Language) http://tinyurl.com/1LhSWhpH
data.table #1LhW7Tvj (R_Language) http://tinyurl.com/1LhW7Tvj
dplyr(上) #1LhpJCfB (R_Language) http://tinyurl.com/1LhpJCfB
dplyr(下) #1Lhw8b-s (R_Language)
tidyr #1Liqls1R (R_Language) http://tinyurl.com/1Liqls1R
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.218.152.118
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1458237598.A.088.html
※ 編輯: celestialgod (180.218.152.118), 03/18/2016 02:02:24
推
03/18 02:09, , 1F
03/18 02:09, 1F
推
03/18 11:04, , 2F
03/18 11:04, 2F
推
03/28 00:27, , 3F
03/28 00:27, 3F
※ 編輯: celestialgod (223.140.244.75), 03/28/2016 23:11:39
討論串 (同標題文章)