Re: [問題] 請問這樣的資料庫大既要多少錢呢?
※ 引述《paiyuliu (萬里無雲)》之銘言:
: 各位晚安:
: 我是目前想利用專利來寫一些實證論文的小小研究生
: 而實證當然是需要大量的資料
: 而在USPTO網站上的資料原始檔(XML那些的)
: 我試著解析過那些檔,也了解到XML的格式
: 只是,非資工出身的我,要解析那些原始檔真的是一個很困難的事情
: 今天有跟連穎科技談了一下
: 後來好像就不了了之(沒回電)
: 我需要的資料為2003到2007年的
: patent number,patent的所屬國家,patent的ISSUE DATE
: 以及這個patent number所引證的專利
: 我只需要這些欄位
: 連穎科技有稍微提過,去年他們賣最新的Raw Data就十幾萬
: 只是,我所需要的只是這幾個欄位,也不需要全部的資料
: 這樣還需要這麼貴嗎?
如果原PO已經下完了所有 USPTO的XML檔的話
我建議自己用程式處理XML 比較快
大部份專利軟體都會下載到其他不需要的資料
不僅資料量變大,網路也用的兇
USPTO 的 XML 有許多和標準 XML 不同的地方,剛開始處理可能會遇到些問題
但有經驗的人我想一兩天就能完成了
PS: 連穎有給寫論文的免費讚助使用 PatentGuider
只要在論文中註明使用到就可以了,可以去談談看
國科會計劃可能就不行了
--
my blog: http://kenshinnn.blogspot.com
operation system : Ubuntu GNU/linux
window manager : Gnome
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.232.5.46
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 5 篇):