[詢問] IMPORTXML&HTML 限制問題
Hi ALL
小弟最近想做個資料分析,想抓一些yahoo 上的新聞回來分析
目前想用這個網址 https://tw.news.yahoo.com/world
所以有幾個問題,想請問
1. importxml 好像有網址長度的限制, 有什方式可解決?
系統說:指定網址內容的資源超出大小上限。
https://imgur.com/QpjwYsD
2. importxml or importhtml 有什辦法可取得資料時又同時取得網址?
又或者有什其它參數or 工具可取得?
https://imgur.com/ynz7L5x
3. importhtml 會只抓第一頁資料,有什方式可以讓它也會向下滾動,
可以去抓第二頁以上的資料?
像是https://tw.news.yahoo.com/world,他預設只能顯示一頁資料,可
必需要偵測到下滾的動作,才會顯示第二頁的資料。
4. importxml or importhtml抓的資料,會同一格去顯示多行的資料,有什
指令可以讓他切成多行?
請多指教,謝謝。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.99.151 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Google/M.1627842154.A.2C0.html
推
08/02 09:08,
2年前
, 1F
08/02 09:08, 1F
→
08/02 09:10,
2年前
, 2F
08/02 09:10, 2F
→
08/02 09:18,
2年前
, 3F
08/02 09:18, 3F
→
08/02 09:18,
2年前
, 4F
08/02 09:18, 4F
推
08/02 20:06,
2年前
, 5F
08/02 20:06, 5F
→
08/02 20:08,
2年前
, 6F
08/02 20:08, 6F
→
08/02 23:34,
2年前
, 7F
08/02 23:34, 7F
→
08/02 23:36,
2年前
, 8F
08/02 23:36, 8F
推
08/03 05:45,
2年前
, 9F
08/03 05:45, 9F
→
08/03 05:47,
2年前
, 10F
08/03 05:47, 10F
→
08/03 05:48,
2年前
, 11F
08/03 05:48, 11F
→
08/03 05:48,
2年前
, 12F
08/03 05:48, 12F