pandas讀檔的問題

看板Python作者 (307)時間7年前發表 (2018/05/21 06:21), 7年前編輯推噓2(202)
留言4則, 3人參與, 7年前最新討論串1/1
大家好 我現場有大概2000份檔案,每個都要用pandas去讀 可是有個問題是這些檔案的columns數量可能不太一樣 比方說有的檔案有8個columns,但有的卻有10個 我現在希望每個檔案的column名稱都以那10個columns的為主 而如果當下讀的檔案是屬於8個columns的那種,那多出來的那兩個columns裡面的資料就 都用NaN呈現即可 直接設df.columns = [我希望的那10個columns] 這樣顯然不行 有想到讀檔時就用names參數設定,不過手邊沒有電腦還沒試過這樣可不可以 請問這樣的話要怎麼做呢? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.115.204.171 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1526883717.A.BCC.html ※ 編輯: iphone2003 (140.115.204.171), 05/21/2018 14:24:36

05/21 14:53, 7年前 , 1F
pd.concat([df1,df2]) df1是舊的 df2是要加入的
05/21 14:53, 1F

05/22 20:19, 7年前 , 2F
研究了一下似乎真的只能先建好df後再併了...謝謝!
05/22 20:19, 2F

05/24 18:54, 7年前 , 3F
這2000份檔案是想存成2000個df還是一個大df啊?感覺做法
05/24 18:54, 3F

05/24 18:54, 7年前 , 4F
會不同 @@
05/24 18:54, 4F
文章代碼(AID): #1R0cM5lC (Python)