[問題] Selenium locating elements Dcard
我想要做到的是
step1.自動登入Dcard
step2.進入抽卡的page
step3.save page
一開始上網查到mechanize這個工具
http://wwwsearch.sourceforge.net/mechanize/documentation.html
不過在step1就卡關,因為
https://www.dcard.tw/login
找不到<form>的tag
所以我放棄了mechanize,上網查到了selenium這個工具
http://selenium-python.readthedocs.io/
用find_element_by_XXX()的方法做完了step1
不過在step2又卡關了
http://imgur.com/fNujpAJ
如圖
抽卡的page是在點擊紅色圈圈處會到的page
而紅色圈圈處對應的code是紅色框框處
我試過了
find_element_by_partial_link_text('card')
find_element_by_class_name('fa-book')
find_element_by_css_selector('i.fa.fa-book')
find_element_by_css_selector('i.fa-book')
結果都是
NoSuchElementException: Message: Unable to locate
element: {"method":"METHOD_NAME","selector":"XXX"}
而
find_element_by_class_name('fa fa-book')
結果是
InvalidSelectorException: message: The given selector
fa fa-book is either invalid or does not result in a WebElement.
The following error occurred:
InvalidSelectorError: Compound class names not permitted
請問大家這是發生了什麼問題?find_element_by_XXX()應該要怎麼寫?
還是用別的方法來寫會比較好寫?
假如後來有順利寫完step1~step3,有辦法排程讓程式每天固定執行一次嗎?
另外想問如果用jQuery做我這個需求會更簡單,更好做嗎?
以上謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.147.21.11
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1462600069.A.E3A.html
※ 編輯: Carlchen (122.147.21.11), 05/07/2016 13:50:01
→
05/07 16:55, , 1F
05/07 16:55, 1F
s86大,你說的是find_element_by_class_name('fa')嗎?
這個我有試過,只是它回傳的是第一個出現class='fa'的地方,也就是會到feedback的pa
ge,可惜不是我要前往的page
→
05/07 19:03, , 2F
05/07 19:03, 2F
→
05/07 19:04, , 3F
05/07 19:04, 3F
→
05/07 19:04, , 4F
05/07 19:04, 4F
剛剛試了這個
find_element_by_css_selector(
'li[ng-click*="onClickNavigationItem(\'dcard\')"]')
還是 NoSuchElementException...
不知道是怎麼回事@@
→
05/08 11:23, , 5F
05/08 11:23, 5F
→
05/08 11:29, , 6F
05/08 11:29, 6F
→
05/08 11:30, , 7F
05/08 11:30, 7F
→
05/08 11:33, , 8F
05/08 11:33, 8F
→
05/08 11:35, , 9F
05/08 11:35, 9F
謝謝s大的幫忙,剛剛試過了,是OK的
不過動態生成是什麼我不知道@@
另外還有個問題,selenium的作法是要打開browser
如果在server上跑(純文字介面),是不是就不會work了?可能要用別的工具來寫?
→
05/08 17:14, , 10F
05/08 17:14, 10F
噓
05/08 19:54, , 11F
05/08 19:54, 11F
謝謝指教喔~如果我只是想要截圖,我就不會上來問了XD
※ 編輯: Carlchen (122.147.21.11), 05/08/2016 20:32:16
→
05/08 22:21, , 12F
05/08 22:21, 12F
→
05/08 22:22, , 13F
05/08 22:22, 13F
→
05/08 22:24, , 14F
05/08 22:24, 14F