Re: [問題] 請問交叉查榜網頁的資料來源?

看板Web_Design作者 (好人大聯盟)時間18年前 (2008/03/30 15:25), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/2 (看更多)
※ 引述《stevenf3 (Life)》之銘言: : 最近幾天研所考試放榜 : 看到別人寫的交叉查榜系統網址如下: : http://icross.hopto.org/ : 有點好奇他的資料來源是什麼? : 因為像是一般學校的榜單 : 通常都只提供網頁或是pdf檔 : 他是怎麼做到可以抓到這些資料的@_@? : 是自己再建到自己的資料庫嗎? : 可是這樣應該要一段時間吧!? 工人智慧輸入榜單的時代已經過去了 :D 因為榜單幾乎都有固定的 pattern ,大多是一個系所 ,接一堆正備取的准考證及姓名。所以只要有一隻 parser ,由程式來自動分析出所有需要的 token ,再輸入進資料 庫即可。 -- 我覆蓋三千張好人卡在檯面上,回合結束。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.123.105.22
文章代碼(AID): #17xq1imp (Web_Design)
文章代碼(AID): #17xq1imp (Web_Design)