[問題] 初學python疑問

看板Python作者 (lemonade)時間5年前 (2019/01/13 05:20), 5年前編輯推噓5(504)
留言9則, 6人參與, 5年前最新討論串1/1
小弟最近剛開始學爬蟲,爬完某版的推文把它存成一個list後,想讓他只留下英文及數字,把中文刪掉。爬完推文後大概長這樣:http://i.imgur.com/YE386iH.jpg
請問各位大神有什麼方法可以達成這個目的嗎?google了好久都找不到QQ ----- Sent from JPTT on my HTC_U-3u. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.217.93.229 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1547328009.A.FF3.html

01/13 08:40, 5年前 , 1F
python有內建確認一個字是letter或digit的函數1
01/13 08:40, 1F

01/13 09:24, 5年前 , 2F
isalnum跑迴圈?
01/13 09:24, 2F
現在是一個list裡面每一個都包含中文和英文數字 跑迴圈應該沒辦法單獨把我要的抓出來吧? ※ 編輯: yeah66666 (140.113.136.220), 01/13/2019 10:11:03

01/13 11:39, 5年前 , 3F
可考慮字串重新編碼 非asci的忽略 → list_eng = [s.en
01/13 11:39, 3F

01/13 11:40, 5年前 , 4F
code('utf8').decode('ascii','ignore') for s in list
01/13 11:40, 4F

01/13 11:40, 5年前 , 5F
_eng]
01/13 11:40, 5F
算有成功但list裡面每個我要的字旁邊都有很多空格…我還是不知道要怎麼把空格刪掉

01/13 12:36, 5年前 , 6F
用regular expression?
01/13 12:36, 6F

01/13 13:17, 5年前 , 7F
re讚讚
01/13 13:17, 7F
※ 編輯: yeah66666 (110.50.134.172), 01/13/2019 16:07:57

01/13 16:42, 5年前 , 8F
推正規運算法
01/13 16:42, 8F
重新編碼後再跑一次正規就成功了 謝謝各位!!

01/13 17:26, 5年前 , 9F
刪除空白可以試試strip()
01/13 17:26, 9F
※ 編輯: yeah66666 (110.50.134.172), 01/13/2019 17:45:50
文章代碼(AID): #1SEbe9_p (Python)