[問題] .txt資料分隔問題

看板C_and_CPP作者 (狼狽比失去難受)時間12年前 (2012/04/18 04:02), 編輯推噓4(406)
留言10則, 6人參與, 最新討論串1/1
開發平台(Platform): (Ex: VC++, GCC, Linux, ...) Dev C++ 額外使用到的函數庫(Library Used): (Ex: OpenGL, ...) 問題(Question): 手上有一些網頁使用者的瀏覽記錄需要分析 而raw data有許多不需要的資訊 所以想要先刪掉 raw data中 一筆記錄中的資訊是以空格隔開欄位內容 再以換行符號區隔下一筆(如下input) 但現在發現有少部分的欄位資訊中有空格的存在 例如"How are you" 雖然比例極低(目前看了35萬筆只出現5筆) 但卻會造成在那筆之後的欄位資料跑掉 之後會有更多資料要跑 實在不想人工去檢查哪裡跑掉 而又沒有其他可做區隔的符號 請問有什麼方法可以解決這個問題呢 感激不盡~ 餵入的資料(Input): A B C D //假設每行都四欄 E F G H Apple Battle Castle Google Elmo Fantacy Good bye How are you I J K L 預期的正確結果(Expected Output): A C E G Apple Castle Elmo Good bye I J K L 錯誤結果(Wrong Output): A C E G Apple Castle Elmo Good // 從這開始欄位資訊截取錯誤 How you // 影響之後的寫入 J L 程式碼(Code):(請善用置底文網頁, 記得排版) http://pastie.org/3806400 還是附上code 補充說明(Supplement): -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.45.134.141 ※ 編輯: sleepwu 來自: 114.45.134.141 (04/18 04:08)

04/18 05:45, , 1F
突然發現問題似乎可以簡化成:如何將某一欄的空格取代掉
04/18 05:45, 1F

04/18 05:45, , 2F
因為會出現空格的只有那個欄位
04/18 05:45, 2F

04/18 05:46, , 3F
但還是不知道怎麼做Orz 新手
04/18 05:46, 3F

04/18 09:48, , 4F
至少先以換行符號作為判斷點吧, 這樣就不會一路錯下去
04/18 09:48, 4F

04/18 09:48, , 5F
其他的...看有沒有辦法更換分隔符號囉
04/18 09:48, 5F

04/18 13:45, , 6F
設一個文字比對的資料褲如何?
04/18 13:45, 6F

04/18 19:35, , 7F
getline在分析囉~C++有regexp嗎?
04/18 19:35, 7F

04/18 19:45, , 8F
新版 C++ 有
04/18 19:45, 8F

04/19 13:08, , 9F
如果只有第三欄有問題,那先抓一二欄,剩下的拆成兩段
04/19 13:08, 9F

04/19 13:09, , 10F
最後一個空格後的是第四欄,之前的是第三欄
04/19 13:09, 10F
文章代碼(AID): #1FZSnDrY (C_and_CPP)