Re: [問題] 讀取UTF-8編碼
看板C_and_CPP作者descent (「雄辯是銀,沉默是金」)時間11年前發表 (2014/04/19 07:09), 11年前編輯推噓6(6推 0噓 31→)留言37則, 6人參與討論串2/2 (看更多)
c++11 有個 unicode 功能, 不過我覺得可能沒想像中好用。
處理 utf8 string, 我覺得 qt 的 qstring 很好用, 你可以試試看,
就算不寫 gui 程式, 我也會用 qstring 來處理 utf8 string,
實在方便不少, 就像用 std::string 那樣的好用。
也許會覺得要處理 utf8 string 得 link qt 這個大東西很恐怖,
不過事實上處理 utf8 就是這麼困難。
https://github.com/descent/progs/tree/master/handle_utf8_string_by_qstring
給你參考。
QApplication app(argc, argv);
就算你不寫 gui 一定也需要宣告 QApplication, 否則中文 utf8 string
會有問題, 我不知道為什麼?
若要處理 xml, 我用過 qt QDomDocument class, 你可以試試看。
※ 引述《wsx100 ()》之銘言:
: 開發平台(Platform): (Ex: VC++, GCC, Linux, ...)
: linux, gcc
: 問題(Question):
: 文件是xml
: 採用UTF-8編碼
: 如果用char *[]去處理的話 之後要針對標點符號split會失敗
: 所以我查到用wchar_t *[]去處理
: 可是結果不如預期
: 餵入的資料(Input):
: 底下連結是xml檔案
: https://dl.dropboxusercontent.com/u/100819329/file.zip
: 預期的正確結果(Expected Output):
: <?xml version="1.0" encoding="UTF-8"?>
: <xml>
: <p>
: <id>01</id>
: <p>你好</p>
: 錯誤結果(Wrong Output):
: <?xml version="1.0" encoding="UTF-8"?>
: <xml>
: <p>
: <id>01</id>
: <p>
: 程式碼(Code):(請善用置底文網頁, 記得排版)
: https://gist.github.com/anonymous/11058612
: 補充說明(Supplement):
: 我從下午6點用到晚上2點還沒搞定@@
: 或是有別的方法可以把UTF-8的xml正確讀入呢@@?
: 之後要能夠支援依照標點符號切割成子字串..
: 請高手指點!
: 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.137.79
※ 文章網址: http://www.ptt.cc/bbs/C_and_CPP/M.1397891361.A.DB6.html
→
04/19 16:00, , 1F
04/19 16:00, 1F
→
04/19 16:01, , 2F
04/19 16:01, 2F
→
04/19 16:01, , 3F
04/19 16:01, 3F
→
04/19 16:02, , 4F
04/19 16:02, 4F
→
04/19 17:30, , 5F
04/19 17:30, 5F
→
04/19 17:32, , 6F
04/19 17:32, 6F
→
04/19 17:34, , 7F
04/19 17:34, 7F
→
04/19 17:35, , 8F
04/19 17:35, 8F
→
04/19 17:46, , 9F
04/19 17:46, 9F
→
04/19 17:47, , 10F
04/19 17:47, 10F
※ 編輯: descent (58.114.144.217), 04/19/2014 17:49:12
→
04/19 17:49, , 11F
04/19 17:49, 11F
→
04/19 17:52, , 12F
04/19 17:52, 12F
推
04/19 17:53, , 13F
04/19 17:53, 13F
→
04/19 17:53, , 14F
04/19 17:53, 14F
→
04/19 17:54, , 15F
04/19 17:54, 15F
→
04/19 17:54, , 16F
04/19 17:54, 16F
→
04/19 17:55, , 17F
04/19 17:55, 17F
→
04/19 17:56, , 18F
04/19 17:56, 18F
→
04/19 17:58, , 19F
04/19 17:58, 19F
→
04/19 17:59, , 20F
04/19 17:59, 20F
→
04/19 18:04, , 21F
04/19 18:04, 21F
→
04/19 18:05, , 22F
04/19 18:05, 22F
→
04/19 18:08, , 23F
04/19 18:08, 23F
→
04/19 18:08, , 24F
04/19 18:08, 24F
→
04/19 18:13, , 25F
04/19 18:13, 25F
→
04/19 18:17, , 26F
04/19 18:17, 26F
推
04/19 18:21, , 27F
04/19 18:21, 27F
推
04/19 18:45, , 28F
04/19 18:45, 28F
→
04/19 18:47, , 29F
04/19 18:47, 29F
→
04/19 18:47, , 30F
04/19 18:47, 30F
→
04/19 18:48, , 31F
04/19 18:48, 31F
→
04/19 18:49, , 32F
04/19 18:49, 32F
→
04/19 18:49, , 33F
04/19 18:49, 33F
推
04/19 19:21, , 34F
04/19 19:21, 34F
推
04/21 11:37, , 35F
04/21 11:37, 35F
推
04/21 11:41, , 36F
04/21 11:41, 36F
→
04/21 11:42, , 37F
04/21 11:42, 37F
討論串 (同標題文章)