[問題] ascil問題

看板Python作者 (lenofire)時間7年前 (2017/02/16 16:28), 編輯推噓5(5013)
留言18則, 6人參與, 最新討論串1/1
我是用beautiful soup 來抓連結,print是沒問題,但 為什麼 write 是會出現 編碼錯 誤問題,請問如何處理? http://i.imgur.com/GRkRZ9T.jpg
http://i.imgur.com/Yjfi7Hl.jpg
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.22.18.105 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1487233729.A.D57.html

02/16 18:01, , 1F
話說不用import csv嗎
02/16 18:01, 1F

02/16 18:02, , 2F
encode看看
02/16 18:02, 2F

02/16 18:07, , 3F
Encode 又出現另一bug
02/16 18:07, 3F

02/16 18:08, , 4F
Txt也試過,也有同樣問題
02/16 18:08, 4F

02/16 18:31, , 5F
link.get('href').encode('ascii', 'ignore')
02/16 18:31, 5F

02/16 18:33, , 6F
因為網頁的link裡 某一個後面摻了奇怪的字元
02/16 18:33, 6F

02/16 18:35, , 7F
可以試試 print repr(link.get('href')) 印出來看
02/16 18:35, 7F

02/16 19:29, , 8F
我print成功再print有什麼用
02/16 19:29, 8F

02/16 19:44, , 9F
用codecs開檔寫即可
02/16 19:44, 9F

02/16 21:24, , 10F
什麼叫codec??
02/16 21:24, 10F

02/16 22:05, , 11F
codecs 是一個用來處理編碼的 module
02/16 22:05, 11F

02/16 22:05, , 12F
02/16 22:05, 12F

02/16 22:06, , 13F
py3 的 open 函數可以指定編碼,py2 要用 codecs.open 或
02/16 22:06, 13F

02/16 22:06, , 14F
io.open
02/16 22:06, 14F

02/17 08:13, , 15F
感謝,已解決,順道問大家用python都是在ubuntu作業系
02/17 08:13, 15F

02/17 08:13, , 16F
統環境下?
02/17 08:13, 16F

02/17 09:16, , 17F
是用 Linux,但不一定是 Ubuntu,小弟用 Debian
02/17 09:16, 17F

02/17 13:28, , 18F
我輸出看看發現你抓的資料最後一個是NoneType耶
02/17 13:28, 18F
文章代碼(AID): #1OfMB1rN (Python)