作者查詢 / starcaspar

總覽項目: 發文 | 留言 | 暱稱
作者 starcaspar 在 PTT [ Python ] 看板的留言(推文), 共27則
限定看板:Python
看板排序:
首頁
上一頁
1
下一頁
尾頁
[問題] Selenium 擷取跳出視窗
[ Python ]33 留言, 推噓總分: +1
作者: ntumath - 發表於 2017/06/03 00:01(8年前)
1Fstarcaspar: 考慮用requests嗎?06/03 22:43
2Fstarcaspar: https://hackmd.io/s/r1B0cHxzb06/03 22:44
3Fstarcaspar: 原因是這樣的,他的window是由js產生出來的,沒有sour06/03 22:45
4Fstarcaspar: ce code06/03 22:45
5Fstarcaspar: 所以Page Source抓到空06/03 22:45
6Fstarcaspar: 用Burp找到了POST方法,放在上面那個連結,參數可以依06/03 22:48
7Fstarcaspar: 據你要的去調整06/03 22:48
12Fstarcaspar: 不不,那不是時間問題06/06 11:02
13Fstarcaspar: 正如我上面說的,他是js產生的,他有render之後的code06/06 11:02
14Fstarcaspar: ,但沒有source code,所以你chrome可以按「檢查」,06/06 11:02
15Fstarcaspar: 但是不能按「檢視原始碼」06/06 11:02
16Fstarcaspar: 因此selenium的page source在這時候是拿不到東西的06/06 11:04
17Fstarcaspar: 不不,只是我還沒找到方法而已06/06 12:05
23Fstarcaspar: 這個bug應該不是只是driver喔06/07 23:23
24Fstarcaspar: 你有對網頁右鍵檢視原始碼嗎?06/07 23:23
25Fstarcaspar: 切到window之後很多函數都卡住了06/08 11:06
26Fstarcaspar: 你介意覆寫他的openWindow函數嗎06/08 11:06
27Fstarcaspar: 你注意看,其實你要的東西都在那個函數產生的06/08 11:06
28Fstarcaspar: 如果用execute_script去覆寫或是另外執行這樣去取得資06/08 11:06
29Fstarcaspar: 料06/08 11:06
30Fstarcaspar: 另外其實我個人覺得selenium作用來測試,雖然他也是可06/08 11:06
31Fstarcaspar: 以作為爬蟲的目的啦06/08 11:06
32Fstarcaspar: 不然換個driver跑,或許還比較快解決06/08 11:07
[問題] Dcard圖片爬蟲遇到https該如何解決
[ Python ]16 留言, 推噓總分: +1
作者: craig1122321 - 發表於 2017/05/11 18:47(8年前)
13Fstarcaspar: 我覺得名稱有斜線在檔案上會出問題06/03 23:23
14Fstarcaspar: with open('./imgs/' + str(fn.split("/")[-1])06/03 23:23
15Fstarcaspar: (後面自行補齊)開檔存檔留下最後的檔名就好了06/03 23:24
16Fstarcaspar: 補:https在repl會出問題,不是code的問題06/03 23:28
首頁
上一頁
1
下一頁
尾頁