Re: [請益] 做這行的基本條件

看板Soft_Job作者 (.)時間12年前 (2013/06/19 01:42), 編輯推噓2(202)
留言4則, 4人參與, 最新討論串6/6 (看更多)
: → C6H5CH3:只是用perl作的爛程式, 印象中幾百行就搞定了 06/18 22:15 : → C6H5CH3:不過倒讓我騙到第一份工作 06/18 22:15 : → dryman:使用WWW::Mechanize的話應該可以再把行數縮短一點XD 06/18 22:30 perl中有一個模組叫 Web::Query 簡單來說就是靠像jquery的selector概念和接近語法 來撈html裡面的物件 我正規比對不行 沒下工夫 靠這個瞬間ko掉 這個好用....好用到有點變態 前一份工作我離職前 公司好像叫我做了一份假專案 叫我把幾大購物網的賣的東西 全站砍下來 抓商品名稱.編號.售價 資訊 全都撈下來後 最後匯入資料庫 做全文檢索(幸好perl有唐鳳姊的切詞模組可以用) 好像要做啥比價網之類的 不過不知道是網站架構變了(這個比較可能) 還是有擋 現在無聊測試看看 發覺程式都失效了 不過覺得這種砍站行為不太道德就是..... 但是似乎網站沒開放API的話 也都是這樣砍的 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 編輯: erspicu 來自: 61.70.105.149 (06/19 01:46)

06/19 01:54, , 1F
我習慣用python+BeautifulSoup
06/19 01:54, 1F

06/19 11:35, , 2F
學習了!
06/19 11:35, 2F

06/19 13:55, , 3F
都乖乖用REGEX Orz
06/19 13:55, 3F

06/20 14:38, , 4F
= =我也是用regex在砍
06/20 14:38, 4F
文章代碼(AID): #1Hm9l_8i (Soft_Job)
文章代碼(AID): #1Hm9l_8i (Soft_Job)