Re: [程式] R語言中ID排序編號

看板Statistics作者gsuper (統計的巴比倫塔)時間15年前 (2011/01/25 22:26)推噓0(0推 0噓 6→)

留言6則, 3人參與討論串2/2 (看更多)

43 : ----------------------------------- : 原有ID 診斷碼擬創造新ID : ABCDEQ 295 1 : ABCDEQ 001 1 : ABCDEQ 005 1 : DDWWSWW 420 2 : DDWWSWW 538 2 : DDWWSWW 292 2 : KKQZZAQ 141 3 : KKQZZAQ 141 3 : . 我會這樣寫 DATA <- 上面的矩陣 DATA <- cbind( DATA,NEW_ID=rep("",dim(DATA)[1]) ) DATA[,"NEW_ID"] <- as.numeric(factor(DATA[,"原有ID"])) 我覺得就算有100萬筆也不會花太久時間阿為什麼會跑到一周? ------------------------------------- 7000萬筆我來測測看 ------------------------------------- > dim(e) [1] 78000000 2 > e[1:10,] e [1,] "aA1aA1aA1" "" [2,] "bB2bB2bB2" "" [3,] "cC3cC3cC3" "" [4,] "dD4dD4dD4" "" [5,] "eE5eE5eE5" "" [6,] "fF6fF6fF6" "" [7,] "gG7gG7gG7" "" [8,] "hH8hH8hH8" "" [9,] "iI9iI9iI9" "" [10,] "jJ10jJ10jJ10" "" > e[,2] <- as.numeric(factor(e[,1])) -------------------------------------- 126秒好像有點久.... -- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.239.247 ※ 編輯: gsuper 來自: 140.113.239.247 (01/25 22:27) ※ 編輯: gsuper 來自: 140.113.239.247 (01/25 22:37) ※ 編輯: gsuper 來自: 140.113.239.247 (01/25 22:52)

→

lin15

01/25 23:40, , 1^F

01/25 23:40, 1^F

→

lin15

01/25 23:41, , 2^F

01/25 23:41, 2^F

→

gsuper

01/25 23:43, , 3^F

01/25 23:43, 3^F