[問題] Unicode Decode Error

看板Web_Design作者 (suhang)時間11年前 (2014/10/29 13:28), 編輯推噓2(203)
留言5則, 2人參與, 最新討論串1/2 (看更多)
我寫了一個crawler爬網頁 按照view page source <meta content="text/html; charset=Big5"> 我用Big5 解碼回傳的 byte string Python卻回應某些byte無法解碼 UnicodeDecodeError: illegal multibyte sequence 1 瀏覽器也是設定Big5解碼 那為什麼瀏覽器可以正確的顯現所有內容? 2 我試著用utf8瞎猜去解碼,一樣有error 請問我該如何處理這個錯誤而能顯示我所抓下來的網頁? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.169.54.91 ※ 文章網址: http://www.ptt.cc/bbs/Web_Design/M.1414560500.A.39C.html

10/29 22:10, , 1F
什麼網頁?
10/29 22:10, 1F

10/30 02:05, , 2F
python內建的decoder很suck,不會略過錯誤的字元
10/30 02:05, 2F

10/30 02:06, , 3F
幾乎無法使用,去找替代的lib如何?
10/30 02:06, 3F

10/30 02:10, , 4F
好吧,其實有忽視錯誤的參數
10/30 02:10, 4F

10/30 02:15, , 5F
10/30 02:15, 5F
文章代碼(AID): #1KK7hqES (Web_Design)
文章代碼(AID): #1KK7hqES (Web_Design)