[問題] .txt資料分隔問題
開發平台(Platform): (Ex: VC++, GCC, Linux, ...)
Dev C++
額外使用到的函數庫(Library Used): (Ex: OpenGL, ...)
問題(Question):
手上有一些網頁使用者的瀏覽記錄需要分析
而raw data有許多不需要的資訊 所以想要先刪掉
raw data中 一筆記錄中的資訊是以空格隔開欄位內容
再以換行符號區隔下一筆(如下input)
但現在發現有少部分的欄位資訊中有空格的存在
例如"How are you"
雖然比例極低(目前看了35萬筆只出現5筆)
但卻會造成在那筆之後的欄位資料跑掉
之後會有更多資料要跑 實在不想人工去檢查哪裡跑掉
而又沒有其他可做區隔的符號
請問有什麼方法可以解決這個問題呢
感激不盡~
餵入的資料(Input):
A B C D //假設每行都四欄
E F G H
Apple Battle Castle Google
Elmo Fantacy Good bye How are you
I J K L
預期的正確結果(Expected Output):
A C
E G
Apple Castle
Elmo Good bye
I J K L
錯誤結果(Wrong Output):
A C
E G
Apple Castle
Elmo Good // 從這開始欄位資訊截取錯誤
How you // 影響之後的寫入
J L
程式碼(Code):(請善用置底文網頁, 記得排版)
http://pastie.org/3806400
還是附上code
補充說明(Supplement):
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.45.134.141
※ 編輯: sleepwu 來自: 114.45.134.141 (04/18 04:08)
→
04/18 05:45, , 1F
04/18 05:45, 1F
→
04/18 05:45, , 2F
04/18 05:45, 2F
→
04/18 05:46, , 3F
04/18 05:46, 3F
推
04/18 09:48, , 4F
04/18 09:48, 4F
→
04/18 09:48, , 5F
04/18 09:48, 5F
推
04/18 13:45, , 6F
04/18 13:45, 6F
→
04/18 19:35, , 7F
04/18 19:35, 7F
推
04/18 19:45, , 8F
04/18 19:45, 8F
推
04/19 13:08, , 9F
04/19 13:08, 9F
→
04/19 13:09, , 10F
04/19 13:09, 10F