[問題] 關於清理資料的問題。
小弟想擷取美國專利第5568207號的資料
相關程式碼如下:
http://codepad.org/DPOXxDkT
問題出在第34行及第36行。
clean_content = re.sub( '\(.*?\)', '', cell_content).strip()
clean_content = re.sub( ' ', ' ', cell_content).strip()
第34行主要用於刪除「()」中的資料。
第36行主要用於刪除「 」中的資料。
但是,不知道為什麼,執行時第36行卻不會執行。
如果將第34行及第36行調換時,則換成第34行不會執行。
請問為什麼會有這樣的情況?應該如何修改,謝謝指教。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.133.32.131
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1493005060.A.5DF.html
→
04/24 16:17, , 1F
04/24 16:17, 1F
→
04/24 16:18, , 2F
04/24 16:18, 2F
→
04/24 16:33, , 3F
04/24 16:33, 3F
→
04/24 17:33, , 4F
04/24 17:33, 4F