Re: [問題] utf8 encoding to decoding

看板Python作者 (←這人是超級笨蛋)時間9年前 (2016/07/18 17:59), 編輯推噓1(106)
留言7則, 3人參與, 最新討論串2/2 (看更多)
※ 引述《kyuudonut (CC)》之銘言: : 各位先進好 : 小弟最近在抓網站資料 (用3.5) : 結果抓下來的中文先被encoding,儲存成編碼的形式了@@ (EX. \uXXXX) : 查了好久 2.7 好像可以使用decode : 但到 3.5 因為統一使用unicode 所以用str就夠了 : 但小弟試好久都沒有辦法轉成中文 @@ : 因為對於電腦來說 每個都還是一個文字吧!? : 查到的例子中 往往都是 : string = u'\uXXXX' : print(string) : 便可以直接轉成對應字元 : 但小弟現在每一個字都是分開的阿阿阿 : 合在一起是一個字串阿!!!(淚) {'\', 'u', 'X', 'X', 'X', 'X'} : 不知道有沒有先進有過類似開發經驗 : 能夠給個提示或關鍵字 : 謝謝 QAQ data = ['\\', 'u', '5', '9', '2', '7'] s = ''.join(data) b = s.encode('ascii') u = b.decode('unicode_escape') print(u) # 校 -- ╱ ̄ ̄ ̄╲ ▏◢█◣ 成龍表示: 是喔... ′/ ‵ ╰╯ ψQSWEET █◤ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.161.19.12 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1468864768.A.AB1.html

07/19 02:12, , 1F
明明就是 '大' XD 還有一個解 chr(int('5927',16))
07/19 02:12, 1F

07/19 02:13, , 2F
我改了碼忘了改字 XD
07/19 02:13, 2F

07/19 02:14, , 3F
如果是一個字的話上面的方法比較好, 但這種的通常都是一
07/19 02:14, 3F

07/19 02:14, , 4F
串文字包含跳脫序列, 這時候 unicode_escape 就很方便
07/19 02:14, 4F

07/19 02:15, , 5F
你說的有理
07/19 02:15, 5F

07/19 09:57, , 6F
轉出來了!!! 謝謝兩位!!! http://imgur.com/llavlCD
07/19 09:57, 6F

07/19 09:57, , 7F
TAT
07/19 09:57, 7F
文章代碼(AID): #1NZHa0gn (Python)
討論串 (同標題文章)
文章代碼(AID): #1NZHa0gn (Python)