[問題] Unicode Decode Error
我寫了一個crawler爬網頁
按照view page source <meta content="text/html; charset=Big5">
我用Big5 解碼回傳的 byte string
Python卻回應某些byte無法解碼
UnicodeDecodeError: illegal multibyte sequence
1
瀏覽器也是設定Big5解碼
那為什麼瀏覽器可以正確的顯現所有內容?
2
我試著用utf8瞎猜去解碼,一樣有error
請問我該如何處理這個錯誤而能顯示我所抓下來的網頁?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.169.54.91
※ 文章網址: http://www.ptt.cc/bbs/Web_Design/M.1414560500.A.39C.html
推
10/29 22:10, , 1F
10/29 22:10, 1F
推
10/30 02:05, , 2F
10/30 02:05, 2F
→
10/30 02:06, , 3F
10/30 02:06, 3F
→
10/30 02:10, , 4F
10/30 02:10, 4F
→
10/30 02:15, , 5F
10/30 02:15, 5F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):