[問題] pandas爬蟲 .read_html

看板Python作者 (intr)時間8年前 (2017/09/22 16:26), 編輯推噓1(105)
留言6則, 3人參與, 最新討論串1/1
大家好,小弟初自學python,主要就是跟著以下影片內容照做一次 今天練習這篇 https://www.youtube.com/watch?v=LkUozoHHWhs
, 完全照他的語法寫,但這句 df = pandas.read_html('http://jsjustweb.jihsun.com.tw/z/zc/zcq/zcq_1101.djhtm')卻得到結果 都會跑出錯誤,最後顯示 this version of raise is a syntax error in Python 3 想請問問題是出在哪裡 ?? Google很久還是找不到原因,謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.120.242.2 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1506068779.A.5AC.html

09/22 22:31, , 1F
試試看 from io import StringIO
09/22 22:31, 1F

09/22 22:32, , 2F
喔 等等 我好像弄錯了
09/22 22:32, 2F

09/22 22:54, , 3F
我這邊用python2沒這個問題 可是他找不到表格= =
09/22 22:54, 3F

09/23 09:55, , 4F
回樓上,找不到表格 +1
09/23 09:55, 4F

09/26 01:48, , 5F
跳過第一個字元 <!DOCTYPE> 把你們的爬蟲搞爆了~
09/26 01:48, 5F

09/26 01:50, , 6F
t = requests.get(url).text;pandas.read_html(t[1:])
09/26 01:50, 6F
文章代碼(AID): #1PnCahMi (Python)