Re: [問題] 請問交叉查榜網頁的資料來源?
※ 引述《stevenf3 (Life)》之銘言:
: 最近幾天研所考試放榜
: 看到別人寫的交叉查榜系統網址如下:
: http://icross.hopto.org/
: 有點好奇他的資料來源是什麼?
: 因為像是一般學校的榜單
: 通常都只提供網頁或是pdf檔
: 他是怎麼做到可以抓到這些資料的@_@?
: 是自己再建到自己的資料庫嗎?
: 可是這樣應該要一段時間吧!?
工人智慧輸入榜單的時代已經過去了 :D
因為榜單幾乎都有固定的 pattern ,大多是一個系所
,接一堆正備取的准考證及姓名。所以只要有一隻 parser
,由程式來自動分析出所有需要的 token ,再輸入進資料
庫即可。
--
我覆蓋三千張好人卡在檯面上,回合結束。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.123.105.22
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):