[問題] Python urllib.urlopen 抓取有繁體網頁

看板Python作者 (哈哈哈)時間12年前 (2013/07/29 14:06), 編輯推噓2(205)
留言7則, 4人參與, 最新討論串1/3 (看更多)
請教大家 Python 2.7.3 有使用下面utf-8的宣告 #!/usr/bin/python # -*- coding: utf-8 -*- 問題: 使用 web = urllib.urlopen(內容具有繁體中文的網站) content = web.read() 想分析網頁內容為繁體的部分,結果繁體部分會變成亂碼, 似乎是ascii之類的編碼問題 想請教有人有遇過這類型問題嗎~謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.43.211.213

07/29 22:12, , 1F
還是說他是big5編碼?
07/29 22:12, 1F

07/29 22:28, , 2F
如果是big5要怎麼改
07/29 22:28, 2F

07/29 22:45, , 3F
content = web.decode(編碼名稱).read()
07/29 22:45, 3F

07/29 23:15, , 4F
樓上方法~會出現AttributeError: addinfourl instance ha
07/29 23:15, 4F

07/29 23:17, , 5F
s no attribute 'decode' 這是不是我有忽略或漏甚麼~
07/29 23:17, 5F

07/29 23:17, , 6F
應該是 content.decode ~
07/29 23:17, 6F

07/29 23:23, , 7F
寫反了, 是要先 read...
07/29 23:23, 7F
文章代碼(AID): #1HzdRx_A (Python)
討論串 (同標題文章)
文章代碼(AID): #1HzdRx_A (Python)