因為專題上的需要,
必須從網頁上抓取資料,
該網頁有下拉式選單(Select),
是用來選擇每頁要顯示的筆數,
一開始是「15」筆,
當我使用 IE 選取下拉式選單的「100」筆時,
他會更換到另一個頁面,
但是當我用Java的htmlUnit API時,
我沒辦法取得更新後的網頁內容,
Google了兩天,
有人說是因為網頁還沒讀完我就用程式擷取,
但是當我修改完程式碼後,
發現還是擷取不到,
不知道大大有沒有什麼想法,
謝謝!!!
以下是內容:
HtmlTable table = (HtmlTable)page.getElementsByTagName("table").item(0);
List<HtmlElement> perPage = page.getElementsByName("perPage");
HtmlSelect selectDataNum = (HtmlSelect)perPage.get(0);
===以上是抓到該select的程式碼===
final HtmlOption option = selectDataNum.getOptionByValue("100");
page2 = (HtmlPage)selectDataNum.setSelectedAttribute(option, true);
===以上是把該select設定為100筆資料===
page2.getEnclosingWindow().getThreadManager().joinAll(10000);
===以上的程式碼功用是等網頁讀取完畢====
System.out.println(page2.asXml().toString());
===印出來===
目標網頁的圖片:
「15」筆 http://ntustece.twbbs.org:8080/download/pic1.JPG
目標網頁的網址:
http://etds.ncl.edu.tw/theabs/site/browse_advisor_chinese.jsp
在text輸入「李遠哲」(隨便打都可以 XD),
就可以跳轉到圖片所顯示的頁面
謝謝大大看到最後,感謝~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.118.62.50
推
02/25 00:46, , 1F
02/25 00:46, 1F