[問題] 問unicode編碼問題

看板C_and_CPP作者 (忘記過去吧! 請給我自由)時間14年前 (2010/06/21 09:51), 編輯推噓3(306)
留言9則, 4人參與, 最新討論串1/1
不知道在這裡問unicode對不對? 不過我想很多前輩在處理unicode編碼時, 應該碰過不少問題。 遇到的問題: (題意請描述清楚) 在網路上看到一份unicode表,表格放在: http://www.geocities.co.jp/Bookend-Shikibu/1091/unicode.html 我覺得很有趣的地方是...為何unicode表裡面會存放相同的字但是有不同的編碼。 比如: "不",同時出現在19981和63847 "茶",同時出現在33590和63998 "在",同時出現在21271和63843 不勝枚舉... 然後才發現unicode編碼裡,從第63744個,也就是第249行開始,一直到第64045個, 全部都是中文,很多重複的字皆出現在這個範圍裡。 請問為何會有這種相同的字但是卻有不同編碼的狀況出現? 再者,為何在建立unicode對應表時,會把中文字的對應拆成兩個部落?? 第一個部落是第19731個到第40869個,第二個部落是第63744個到第64045個。 為何會搞這樣呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc)

06/21 09:52, , 1F
那段應該是中日韓啥的 所以會不會是同形但不同國家的字
06/21 09:52, 1F

06/21 09:52, , 2F
(譬如一個是中文的"不" 一個是日本漢字的"不")
06/21 09:52, 2F

06/21 10:34, , 3F
有沒有可能一個是簡體中文另一個是繁體中文???
06/21 10:34, 3F

06/21 11:15, , 4F
06/21 11:15, 4F

06/21 11:18, , 5F
樓上專業 XD
06/21 11:18, 5F

06/21 11:19, , 6F
其實用j大您的關鍵字就可以在wiki上找到這些info了喔XD
06/21 11:19, 6F

06/21 13:30, , 7F
原PO說的那段 (U+F900~U+FAFF) 是韓文編碼裡的重覆字
06/21 13:30, 7F

06/21 13:30, , 8F
在四樓的 pdf 裡的第 20 頁開始有說明
06/21 13:30, 8F

06/21 14:50, , 9F
謝謝說明~ XD
06/21 14:50, 9F
※ 編輯: yi7310 來自: 74.115.0.2 (09/29 11:24)
文章代碼(AID): #1C7iME1o (C_and_CPP)