[討論] 關於多執行緒爬蟲的觀念與問題

看板Python作者busystudent (busystudent)時間8年前 (2016/04/25 19:17)推噓2(2推 0噓 10→)

留言12則, 5人參與討論串1/1

hi 最近幾天都在板上詢問爬蟲的問題，很感謝大家的指點，想再多問一點延伸的問題，關於多執行緒爬蟲的觀念。我這幾天爬蟲下來，覺得我的程式碼除了沒用使用函式外，執行的效率真得不夠好，我要抓的網頁都超過1000個，執行下來時間與效率都不佳。上stackoverflow發現有介紹多執行緒，感覺這是不錯的解決方法，想跟大家打聽哪裡有適合初學者的相關知識可以查詢，我這幾天找尋下來的結果，總感覺有一定的門檻在。另外很好奇多執行緒可以用於我的程式碼嗎?像是我有這種 links = ['http://www.diigo.com/user/tony_swann/' + x for x in tag_list] 組合式的式子 stackoverflow上關於多執行緒的文 http://goo.gl/iYi8lJ -- Sent from my Windows -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.172.95.247 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1461583065.A.2C5.html ※ 編輯: busystudent (1.172.95.247), 04/25/2016 20:36:27

→

Neisseria

04/25 20:36, , 1^F

04/25 20:36, 1^F

→

busystudent

04/25 20:57, , 2^F

04/25 20:57, 2^F

→

MOONY135

04/25 23:22, , 3^F

04/25 23:22, 3^F