Re: [問題] NCBI爬蟲問題已刪文

看板Python作者Neisseria (Neisseria)時間8年前 (2017/08/22 15:41)推噓1(1推 0噓 2→)

留言3則, 2人參與討論串2/2 (看更多)

※ 引述《dummytrue (就只是大叔而已)》之銘言： : 想要找目前做某個東西的論文中標題出現某個字的出現頻率 : 寫了一隻爬蟲(有用到selenium、BeautifulSoup) : 結果NCBI會封ip : 不知道有推薦其他方法的嗎？ NCBI 自己有出工具啊 E-utilities： Web API，但是沒有包成 RESTful API，是老式的 web 呼叫範例是用 Perl，但其實用其他 http clients 也可以 Python 的話推薦用 requests Entrez Direct: 一組 Unix 命令列工具，將上述 web 呼叫包成命令列工具同樣也是用 Perl 寫成；我試過，在類 Unix 系統才能使用 NCBI 一定會封 IP，不要浪費時間去試爬蟲 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.71.94.20 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1503387708.A.74A.html

推

dummytrue

08/22 17:27, , 1^F

08/22 17:27, 1^F

→

Godkin

08/22 21:42, , 2^F

08/22 21:42, 2^F

→

Godkin

08/22 21:42, , 3^F

08/22 21:42, 3^F