[問題] 一種網址轉換碼

看板Office作者 (Blue night)時間8年前 (2016/01/21 09:38), 編輯推噓4(4017)
留言21則, 3人參與, 最新討論串1/1
(若是和其他不同軟體互動之問題 請記得一併填寫) 軟體: 版本: 例如http://tw.websaru.com/display.php?action=search&word=%E5%BE%AE%E8%BB%9F 其實後面的 %E5%BE%AE%E8%BB%9F 在原本的網址上顯示是【微軟】 而且類似的查詢都會這樣 原本顯示為中文字 經過複製貼上後就變成這種有%符號的字碼 請問這是甚麼 轉換邏輯又是如何 謝謝 -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.98.114.28 ※ 文章網址: https://www.ptt.cc/bbs/Office/M.1453340334.A.F7F.html

01/21 10:30, , 1F
可google iso-8859-1,是國際標準化的字符集
01/21 10:30, 1F

01/21 10:48, , 2F
那叫UTF-8,只要是UTF-8用在網址上,每個BYTE前都加上 %
01/21 10:48, 2F

01/21 10:51, , 3F
除了標準的英文字不加;空格也會(空格是20所以是%20,HEX值
01/21 10:51, 3F

01/21 10:59, , 4F
請問p大,那"微軟"轉為%E5%BE%AE%E8%BB%9F和UTF-8的編碼有
01/21 10:59, 4F

01/21 11:00, , 5F
一致嗎?因為用"微軟"轉為utf-8為
01/21 11:00, 5F

01/21 11:01, , 6F

01/21 13:42, , 7F
查了一下以http://codex.wiki/post/108593-677提供方式來
01/21 13:42, 7F

01/21 13:46, , 8F
以strlen來判斷時中文字
01/21 13:46, 8F

01/21 13:50, , 9F
為使用三個bytes編碼,再以ord()函數轉以ascii值
01/21 13:50, 9F

01/21 15:59, , 10F
微:UTF16=5FAE;UTF8=E5 BE AE;BIG5=B74C
01/21 15:59, 10F

01/21 15:59, , 11F
軟:UTF16=8EDF;UTF8=E8 BB 9F;BIG5=B36E
01/21 15:59, 11F

01/21 16:02, , 12F
所以你的第1圖是UTF16碼,漢字使用UTF8表示,通常是3BYTES
01/21 16:02, 12F

01/21 16:03, , 13F
而CJK EXT-B,C,D,E的UTF8是用4BYTES表示的
01/21 16:03, 13F

01/21 16:03, , 14F
轉換上是否可查詢的地方
01/21 16:03, 14F

01/21 16:09, , 15F
找一下 Babel Pad程式來用就很強大了
01/21 16:09, 15F

01/21 16:10, , 16F
另外第1圖上面雖然寫的是轉UTF-8但確為是UTF16的意思嗎?
01/21 16:10, 16F

01/21 16:18, , 17F
是的,可能是設定上問題
01/21 16:18, 17F

01/21 16:20, , 18F
已下載,從轉換→utf代碼→統一碼轉換成utf-8代碼處轉換
01/21 16:20, 18F

01/21 16:20, , 19F
01/21 16:20, 19F

01/21 16:25, , 20F
p大的為正確,請原po忽略我的回覆
01/21 16:25, 20F

01/21 17:19, , 21F
感謝指教
01/21 17:19, 21F
文章代碼(AID): #1Me3Qkz_ (Office)