Re: [問題] 如何讀入多個CSV檔

看板R_Language作者 (天)時間8年前 (2016/01/14 17:37), 8年前編輯推噓2(2014)
留言16則, 3人參與, 最新討論串2/7 (看更多)
※ 引述《clansoda (小笨)》之銘言: : 最近在Coursera上面自己學習R語言,可是礙於過去沒寫過程式也沒人能討論 : 因此問的問題很淺顯希望大家見諒 歡迎常來討論^^ : 我現在遇到一個老師給的習題,要我們讀入332個CSV檔案來寫出算平均數的 : Function,我目前是用list.file這個函數先將所有CSV檔案弄成一個list : 那應該就會有一個list有332個vector,我想用for函數讀CSV檔 : 我寫成for (i in 1:length(kk)) {read.csv("D:/kk[[i]].csv")->item} " " 裡面一定是字串,你裡面放變數,他也不會跑出來 要那樣做只能: eval(parse(text = paste0("D:/", kk[[i]]))) 但是我並不推薦用eval的作法 我在MATLAB板每次都會強調eval is evil! 所以下面示範一個比較好的方式做處理 : KK是list的名稱 這樣如果i為一她應該會讀list的第一項叫做001.csv的檔案 : 這是我自己的想法,可是拿去跑之後會顯示 Error in file(file, "rt") : cannot open the connection In addition: Warning : message: : In file(file, "rt") : : cannot open file 'specdata/kktix[[i]]': No such file or directory : 不知道版上有沒有大大可以糾正我的寫法跟觀念。 : [軟體熟悉度]: : 請把以下不需要的部份刪除 : 新手(沒寫過程式,R 是我的第一次) csv_files <- list.files()[grepl('\\.csv', list.files())] # 抓出.csv結尾的檔案 csv_tables <- vector('list', length(csv_files)) for (i in seq_along(csv_files)) csv_tables[[i]] <- read.csv(csv_files[[i]]) 如果你的檔案不是在工作目錄可以這樣改: files <- list.files('path/to/csv', full.names = TRUE) csv_files <- files[grepl('\\.csv', files)] -- R資料整理套件系列文: magrittr #1LhSWhpH (R_Language) http://tinyurl.com/1LhSWhpH data.table #1LhW7Tvj (R_Language) http://tinyurl.com/1LhW7Tvj dplyr(上) #1LhpJCfB (R_Language) http://tinyurl.com/1LhpJCfB dplyr(下) #1Lhw8b-s (R_Language) tidyr #1Liqls1R (R_Language) http://tinyurl.com/1Liqls1R -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.87 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1452764266.A.A7D.html

01/14 18:46, , 1F
想請問list不是比vector還算大一階嗎 為什麼mode可以是
01/14 18:46, 1F

01/14 18:46, , 2F
list 這樣的用意又在哪裡呢?
01/14 18:46, 2F
list跟vector應該沒有什麼階層關係 vector是同類型資料的集合,list是不同類型資料的集合 要講的話,list包含vector比較合理,我記得沒錯的話list是vector of pointers 每一個pointer指向一個object vector是函數,我只是利用這個函數create一個有n個elements的list mode可以設為list是manual寫的,我也不會解釋(攤手

01/14 19:15, , 3F
感謝大大 我還有好幾個問題
01/14 19:15, 3F

01/14 19:15, , 4F
其實不用eval啊,用paste0補路徑也可以
01/14 19:15, 4F
所以我下面有說eval不好,讓他往下看XD

01/14 19:15, , 5F
第一行 雖然我沒學過grepl但是自己摸幾次大概也看得懂在
01/14 19:15, 5F

01/14 19:15, , 6F
在寫什麼
01/14 19:15, 6F

01/14 19:16, , 7F
我寫到for (i in seq(csv_files) 那邊 我有加1:
01/14 19:16, 7F
seq跟seq_along是不同的東西,seq是創造數列,所以通常要起點跟終點 seq_along是沿著物件走,所以如果x是長度n,seq_along(x) 就是1~n的整數

01/14 19:16, , 8F
但是這個寫法是錯的 請問in seq_along就已經是代表1到
01/14 19:16, 8F

01/14 19:17, , 9F
該list的長度了嗎
01/14 19:17, 9F

01/14 19:17, , 10F
現在遇到的問題是print出來的結果確實是所有的CSV檔集合
01/14 19:17, 10F

01/14 19:17, , 11F
代表把變數直接放到i
01/14 19:17, 11F

01/14 19:17, , 12F
但是我想要合併成一個dataframe不知道該如何下手
01/14 19:17, 12F

01/14 19:18, , 13F
直接rbind好像不是正確的解
01/14 19:18, 13F
do.call(rbind, csv_files)

01/14 19:18, , 14F
我回錯@@
01/14 19:18, 14F
沒事XD ※ 編輯: celestialgod (140.109.74.87), 01/14/2016 19:27:44

01/15 09:25, , 15F
is.vector(list()); is.list(vector())
01/15 09:25, 15F

01/15 09:27, , 16F
list是vector. 反之則否.
01/15 09:27, 16F
文章代碼(AID): #1Mbsngfz (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1Mbsngfz (R_Language)