[問題] 大量網頁的特定文字截取?
我真的是一個超新手的初學者
沒有寫程式的經驗,但為了論文需要截取某網頁上的資料(公開資料)
我現在有兩個問題
第一,目前看到截取網頁都是在同一頁內截取
但我需要所有http://xxx.xxx.xxx?ID=XXXXX的所有網頁內容
也就是所有id的網頁都需要,但id並不是連續數字,是網頁的名稱
該如何截取呢?大約有二千頁,我需要一些關鍵字
第二,我只是要裡面三段文字,
可以有個指令是下"我只要以下三個中文字+它們後方的資料"即可?
軟體名稱:____
下載次數:____
軟體價格:___
然後下載成一個excel檔,就整理成:軟體名稱|下載次數|軟體價格的列表
不曉得這樣截取會太暴力而被擋嗎?
希望有個指引可以讓我完成它,先跟大家說聲謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.27.212.83
→
05/29 19:05, , 1F
05/29 19:05, 1F
→
05/29 19:07, , 2F
05/29 19:07, 2F
→
05/29 19:07, , 3F
05/29 19:07, 3F
→
05/29 19:08, , 4F
05/29 19:08, 4F
→
05/29 21:55, , 5F
05/29 21:55, 5F
→
05/29 21:55, , 6F
05/29 21:55, 6F
→
05/29 22:15, , 7F
05/29 22:15, 7F
→
05/29 22:17, , 8F
05/29 22:17, 8F
→
05/29 22:53, , 9F
05/29 22:53, 9F
→
05/30 00:12, , 10F
05/30 00:12, 10F
→
05/30 00:36, , 11F
05/30 00:36, 11F
→
05/30 00:36, , 12F
05/30 00:36, 12F
→
05/30 00:41, , 13F
05/30 00:41, 13F
→
05/30 00:42, , 14F
05/30 00:42, 14F
→
05/30 00:49, , 15F
05/30 00:49, 15F