[問題] 讀取csv中特定的row
[問題類型]:
效能諮詢(我想讓R 跑更快)
[軟體熟悉度]:
使用者(已經有用R 做過不少作品)
[問題敘述]:
小弟有個3.8G多的csv檔,但只想要隨機讀取1/10的row
fread好像沒read specific rows的指令,
難道只能讀整個檔案再select row了嗎?
這樣好沒效率呀.....
若要cross-validation的話光I/O就跑死了....
想請問有沒有更效率一點方法呢?
謝謝了
[程式範例]:
參考網路用fread + nrow and skip 寫了一下,但是更慢Orz.....
但也是預料中啦XDD
http://pastebin.com/gW9W1GmN
[關鍵字]:
fread
--
○ "○ ○" ○"
(|\ (|\ )) ))
/`○rz /`○r27\" ○r27\"
○╭○rz ○rz ○rz-st○
 ̄′ ○=^
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 184.6.253.131
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1457490296.A.858.html
※ 編輯: MADNUG (184.6.253.131), 03/09/2016 10:25:30
※ 編輯: MADNUG (184.6.253.131), 03/09/2016 10:27:24
推
03/09 10:48, , 1F
03/09 10:48, 1F
→
03/09 12:04, , 2F
03/09 12:04, 2F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):