[問題] 如何處理ＵＴＦ8字串及字元

看板C_and_CPP作者pichubaby (Pichu)時間13年前 (2011/02/15 20:21)推噓5(5推 0噓 24→)

留言29則, 8人參與討論串1/1

　　　　如提　ＵＴＦ8會將字元以一到三個位元組（好像最多到六個）下去表示　　但是宣告字串長度時，除了宣告成　　　char str[len*6]以外　還有其他做法嗎？　　或者是直接宣告　　struct uchar{ unsigned char data[6]; }; 會比較好？　　或者我應該考慮固定長度為2個位元組的UTF16 只是這樣對於向下相容ASCII似乎就有麻煩了　http://zh.wikipedia.org/zh/UTF-8 　　　　 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.117.182.94

推

02/15 20:36, , 1^F

02/15 20:36, 1^F

→

02/15 20:36, , 2^F

02/15 20:36, 2^F

→

02/15 20:45, , 3^F

02/15 20:45, 3^F

話說我剛剛查到的資料　是比較常用的都在三個位元組內　四個位元組的字現在似乎已經沒有再使用了　（當然還是可能被使用者拿來作顏文字）　但是這部分的字，假如用wchar_t下去處理，應該會更麻煩 ※ 編輯: pichubaby 來自: 140.117.182.94 (02/15 20:50)

推

02/15 20:58, , 4^F

02/15 20:58, 4^F

推

02/15 21:08, , 5^F

02/15 21:08, 5^F

→

02/15 21:08, , 6^F

02/15 21:08, 6^F

→

02/15 21:31, , 7^F

02/15 21:31, 7^F

→

02/16 00:24, , 8^F

02/16 00:24, 8^F

→

02/16 01:45, , 9^F

02/16 01:45, 9^F

推

02/16 08:35, , 10^F

02/16 08:35, 10^F

→

02/16 12:49, , 11^F

02/16 12:49, 11^F

→

02/16 12:50, , 12^F

02/16 12:50, 12^F

→

02/16 12:53, , 13^F

02/16 12:53, 13^F

→

02/16 12:53, , 14^F

02/16 12:53, 14^F

→

02/16 13:23, , 15^F

02/16 13:23, 15^F

→

02/16 21:28, , 16^F

02/16 21:28, 16^F

假如說使用者輸入一個非big5字碼的字例如韓文那麼iconv應該就無能為力了吧? ※ 編輯: pichubaby 來自: 140.117.182.94 (02/18 01:56)

→

02/18 09:35, , 17^F

02/18 09:35, 17^F

→

02/18 10:21, , 18^F

02/18 10:21, 18^F

→

02/18 10:46, , 19^F

02/18 10:46, 19^F

→

02/18 11:57, , 20^F

02/18 11:57, 20^F

→

02/18 20:26, , 21^F

02/18 20:26, 21^F

→

02/18 20:27, , 22^F

02/18 20:27, 22^F

→

02/18 20:28, , 23^F

02/18 20:28, 23^F

→

02/18 21:00, , 24^F

02/18 21:00, 24^F

→

02/18 21:00, , 25^F

02/18 21:00, 25^F

→

02/19 04:18, , 26^F

02/19 04:18, 26^F

→

02/19 16:06, , 27^F

02/19 16:06, 27^F

推

02/21 20:44, , 28^F

02/21 20:44, 28^F

→

02/23 23:07, , 29^F

02/23 23:07, 29^F

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 pichubaby 的文章

文章代碼(AID): #1DMc_POU (C_and_CPP)