Re: [新聞] 柯P「開放政府」大檢驗 學界:多數資料品質低端、更新不定期已回收
有需求自然會有人去要求開放
在原文中的學者統計開放文件的特性時
不曉得有無考慮什麼樣的資料是民眾最需要的
如說把民眾對資料的需求也分五級
然後去檢視柯市府開放的內容是第一級需求居多 還是最末級需求居多
這還比較有意義
就本人不專業的經驗
現在一般社會人最有需求的是 地產實價登錄
對有置產購屋需求的中產階級 即便沒有 API
至少還有 XML CSV 可以載下來處理
因為這資訊變動沒那麼快
沒有API影響並不大
初步只要做到三星級就促促有餘了
做到四五星可以很久之後再做 根本不急
所以結論是這篇報導 一開始便把評價開放資料的量化標準設歪了
然後用錯誤的前提來推論開放的品質
是廢文一篇
※ 引述《liquidbox (樹枝擺擺)》之銘言:
: : 1★ 採用開放授權,讓手上的資料(任何資料格式)可以在網路上取得
: : 比方說pdf、圖片檔img等等
: : 機器可讀性幾乎是零,只能看不能夠得到數據檔
: : 2★ 讓這份資料能以結構化的方式取得(例如用 Excel 取代掃描的表格)
: : 這就是常見的office,機器可以讀內容,但需要特定的軟體開啟
: 結構化更重要是要把資料轉成起碼是key-value的形式
: 政府很多開放資料雖然近年已在檔案格式上都做到三星,
: 但一打開來其實只有一星,因為裡面根本只是開放格式版的PDF,
: 例如下載了ODS,結果打開來一堆合併儲存格、排版用的spacing、縮排、空列空欄等
: 舊一點的資料裡面可能還有從別的軟體轉檔過程中產生的髒東西
: 在真正開始分析資料以前,大概有80%的時間都用在ETL
: 如果是一般公務單位提供的資料是如此就算了
: 即使中央或地方的主計單位,也幾乎都是提供這類非結構化資料
: 不是沒有官方數據已經做成key-value,
: 但最重要、最完整的,幾乎都還是各種假開放格式、真pdf的東西
: 在我看來,政府的開放資料有95%都只有一星
: : 3★ 使用開放格式取代專屬格式(例如用 CSV 取代 Excel)
: : 大家看到範例csv,其實剛剛提到的json、xml等等常用格式也是
: : 很多網站或app能夠直接吃,就可以顯示數據的圖表或分布
: : 這樣就是三星等
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.120.188.226
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1514629313.A.74A.html
推
12/30 18:22,
8年前
, 1F
12/30 18:22, 1F
推
12/30 18:23,
8年前
, 2F
12/30 18:23, 2F
推
12/30 18:26,
8年前
, 3F
12/30 18:26, 3F
→
12/30 18:26,
8年前
, 4F
12/30 18:26, 4F
→
12/30 18:26,
8年前
, 5F
12/30 18:26, 5F
→
12/30 18:28,
8年前
, 6F
12/30 18:28, 6F

→
12/30 18:28,
8年前
, 7F
12/30 18:28, 7F

噓
12/30 18:29,
8年前
, 8F
12/30 18:29, 8F
推
12/30 18:30,
8年前
, 9F
12/30 18:30, 9F
推
12/30 19:39,
8年前
, 10F
12/30 19:39, 10F
→
12/30 19:39,
8年前
, 11F
12/30 19:39, 11F
→
12/30 19:51,
8年前
, 12F
12/30 19:51, 12F

→
12/30 19:51,
8年前
, 13F
12/30 19:51, 13F

→
12/30 19:51,
8年前
, 14F
12/30 19:51, 14F

→
12/30 19:51,
8年前
, 15F
12/30 19:51, 15F

→
12/30 19:51,
8年前
, 16F
12/30 19:51, 16F

→
12/30 19:52,
8年前
, 17F
12/30 19:52, 17F

→
12/30 19:53,
8年前
, 18F
12/30 19:53, 18F

→
12/30 19:53,
8年前
, 19F
12/30 19:53, 19F
→
12/30 19:54,
8年前
, 20F
12/30 19:54, 20F
→
12/30 21:03,
8年前
, 21F
12/30 21:03, 21F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 5 之 6 篇):