在csv檔中 字串性質的欄位應該會加上""
e.g. "string", number, date
不然字串裡如果有「,」要怎麼辦? (假設這裡是以,為欄位分隔)
結果我手上拿到一堆沒有用雙引號區隔的檔案
以致於我沒有辦法匯入這些檔案
我試過寫程式判斷什麼時候是逗號 什麼時候是分隔
但我想需要很不錯的NLP技術才行......
我想請問一下遇到這樣的問題要怎麼解決?
原則上是不可能請人家重新匯出給我
因為公家單位跑個文應該要一個月吧
而且我很擔心他們不懂我的問題所在
(如果懂的話 當初就不會給格式不符的檔案了吧....)
ps. 因為字串性質的欄位中算是一些口語的紀錄
所以用到逗號的機率頗高
而資料至少上萬筆 我不想一筆一筆幫它們加雙引號 >"<
如果能救我 我會很感謝的 <(_ _)>
--
「
如果我就這麼鬆開手,你會不會永遠記得我?
」
《妖靈皇子》司徒紅
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.150.244
推
09/02 09:32, , 1F
09/02 09:32, 1F
→
09/02 09:42, , 2F
09/02 09:42, 2F
推
09/02 11:46, , 3F
09/02 11:46, 3F
推
09/02 11:57, , 4F
09/02 11:57, 4F
→
09/02 12:19, , 5F
09/02 12:19, 5F
討論串 (同標題文章)