Re: [問題] Python urllib.urlopen 抓取有繁體網頁

看板Python作者timTan (用口頭禪區分年記)時間12年前 (2013/07/29 15:15)推噓3(3推 0噓 5→)

留言8則, 5人參與討論串2/3 (看更多)

※ 引述《bohan222 (哈哈哈)》之銘言： : 請教大家 : Python 2.7.3 有使用下面utf-8的宣告宣告是說你的程式碼是 utf8. 跟你要抓的東西無關。 : #!/usr/bin/python : # -*- coding: utf-8 -*- : 問題: : 使用 web = urllib.urlopen(內容具有繁體中文的網站) : content = web.read() 接下來的 content 只是一些無意義的 binary, 一定要解碼，不解碼，不能看。而解碼的方式，推文已有。編碼有學問這篇 Joe 的文章一定要看過 http://bit.ly/14txdCm : 想分析網頁內容為繁體的部分,結果繁體部分會變成亂碼, : 似乎是ascii之類的編碼問題 : 想請教有人有遇過這類型問題嗎~謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.192.234.137 ※ 編輯: timTan 來自: 123.192.234.137 (07/29 23:15)

→

bohan222

07/29 23:16, , 1^F

07/29 23:16, 1^F

推

lc85301

07/29 23:44, , 2^F

07/29 23:44, 2^F

→

lc85301

07/29 23:45, , 3^F

07/29 23:45, 3^F