Re: [程式] R語言中ID排序編號
43
: -----------------------------------
: 原有ID 診斷碼 擬創造新ID
: ABCDEQ 295 1
: ABCDEQ 001 1
: ABCDEQ 005 1
: DDWWSWW 420 2
: DDWWSWW 538 2
: DDWWSWW 292 2
: KKQZZAQ 141 3
: KKQZZAQ 141 3
: .
我會這樣寫
DATA <- 上面的矩陣
DATA <- cbind( DATA,NEW_ID=rep("",dim(DATA)[1]) )
DATA[,"NEW_ID"] <- as.numeric(factor(DATA[,"原有ID"]))
我覺得就算有100萬筆也不會花太久時間阿
為什麼會跑到一周?
-------------------------------------
7000萬筆我來測測看
-------------------------------------
> dim(e)
[1] 78000000 2
> e[1:10,]
e
[1,] "aA1aA1aA1" ""
[2,] "bB2bB2bB2" ""
[3,] "cC3cC3cC3" ""
[4,] "dD4dD4dD4" ""
[5,] "eE5eE5eE5" ""
[6,] "fF6fF6fF6" ""
[7,] "gG7gG7gG7" ""
[8,] "hH8hH8hH8" ""
[9,] "iI9iI9iI9" ""
[10,] "jJ10jJ10jJ10" ""
> e[,2] <- as.numeric(factor(e[,1]))
--------------------------------------
126秒
好像有點久....
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.239.247
※ 編輯: gsuper 來自: 140.113.239.247 (01/25 22:27)
※ 編輯: gsuper 來自: 140.113.239.247 (01/25 22:37)
※ 編輯: gsuper 來自: 140.113.239.247 (01/25 22:52)
→
01/25 23:40, , 1F
01/25 23:40, 1F
→
01/25 23:41, , 2F
01/25 23:41, 2F
→
01/25 23:43, , 3F
01/25 23:43, 3F
→
01/25 23:44, , 4F
01/25 23:44, 4F
→
01/25 23:44, , 5F
01/25 23:44, 5F
→
01/25 23:51, , 6F
01/25 23:51, 6F
討論串 (同標題文章)