[問題] 中文編碼

看板Python作者 (lulu)時間7年前 (2017/05/16 15:22), 編輯推噓0(003)
留言3則, 2人參與, 最新討論串3/3 (看更多)
我用爬蟲想抓網頁上的中文資料 網頁上標明邊碼方式charset=Big5 我試著在輸入parser的文字內容加上 decode('big5'),但都有一些文字輸出是亂碼 請問有什麼辦法嗎? ----- Sent from JPTT on my Samsung GT-I9300. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.83.15.100 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1494919342.A.C23.html

05/17 01:28, , 1F
試試encode('latin1','ignore').decode('utf-8')
05/17 01:28, 1F

05/18 14:35, , 2F
我遇過,有些只是自身電腦問題....不是很懂為何...
05/18 14:35, 2F

05/18 14:35, , 3F
寫到檔案或資料夾都正常的 只是顯示有問題
05/18 14:35, 3F
文章代碼(AID): #1P6gYkmZ (Python)
討論串 (同標題文章)
文章代碼(AID): #1P6gYkmZ (Python)