[程式] R 的 apply 系列的速度

看板Statistics作者gsuper (統計的巴比倫塔)時間15年前 (2010/06/16 19:51)推噓1(1推 0噓 13→)

留言14則, 6人參與討論串1/1

[軟體程式類別]: R [程式問題]: 資料處理 [軟體熟悉度]: 中(3個月到1年) [問題敘述]: 下面這支程式是要拿 45101 個字串對 130000 個字串做 query 我先前已經知道 R 的迴圈很慢所以改用 apply 和 sapply 但以下的程式把兩種串起來後又變的超慢 (要跑 1 個月 = =a) 請問變慢的原因就是因為把 apply 和 sapply 串起來嗎? 還是因為我大量的進行 unlist 才拖慢? [程式範例]: com_Symbol 是字串矩陣 ( 45101*1 ) NC_list 是 list , [[1]] ~ [[63555]] , 內部是 1~5 個字串 , 總數約 13 萬 ################################################ query_B <- function(input) { x <- sum( unlist(input) %in% tmp ) return(x) } query_A <- function(tmp) { tmp <<- tmp index <- sapply(NC_list,query_B,simplify=T) index2 <- which(index) return(index2) } treasure <- apply( com_Symbol , 1 , query_A) ----------------------------------------------------------------------------- -- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.239.247 ※ 編輯: gsuper 來自: 140.113.239.247 (06/16 20:07) ※ 編輯: gsuper 來自: 140.113.239.247 (06/16 20:08)

推

Wush978

06/16 20:52, , 1^F

06/16 20:52, 1^F

→

lin15

06/16 21:16, , 2^F

06/16 21:16, 2^F

→

cris122

06/16 21:19, , 3^F

06/16 21:19, 3^F