Re: [新聞] 資訊龐大 簡訊實聯制疫調無用

看板Gossiping作者 (小白)時間2年前 (2021/06/30 00:32), 編輯推噓3(305)
留言8則, 6人參與, 2年前最新討論串58/62 (看更多)
※ 引述《saufu08 (saufu)》之銘言: : 有點想問一下,像這樣的資訊 : https://i.imgur.com/b8LOZtl.jpg
: 當初規畫時應該很趕,但沒關係,反正DB就是先開一個table存了再說,然後基本就四個 : 欄位: : 「流水號(自動編號)、場所代碼、手機號碼、時間」。 : 而且這個table只增不刪。 : 累積幾十億筆都沒關係,反正也算是有基本的結構化不是嗎? : 以後需要,再看用什麼高超、快速的技術去select,分析用 group by 就好了不是嗎? : 還是table其實是有開,只是量大到撈不出來嗎? 大致上主table這樣設計,再多加一個場所的table對應場所代碼就可以了。 以資料量來說,前面可以放個一般的資料庫系統,每天晚上在把一天的資料量存到分散式 的dataware house用來作日後的疫調分析 以台灣人口加上店鋪數量來說,只要電話號碼sharding跟partition弄好,店鋪資料應該沒 這麼多,可以直接每一個伺服器都存一份,這樣分析起來應該速度就慢不到哪裡去了。 不知道亞馬遜的雲端服務有沒有開到台灣,不然也可以找他們合作特製一下政府用的私有 雲也可以,還省下了硬體維護的成本。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.13.253.175 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1624984369.A.6CC.html

06/30 00:33, 2年前 , 1F
台灣政府不會把資料放在亞馬遜
06/30 00:33, 1F

06/30 00:36, 2年前 , 2F
最簡單舊資料分割阿 一小時割一塊出來存
06/30 00:36, 2F

06/30 00:37, 2年前 , 3F
反正存放時間過了要刪除 也是照時間刪
06/30 00:37, 3F

06/30 00:44, 2年前 , 4F
台灣也有做資料庫的業者...,這點需求
06/30 00:44, 4F

06/30 00:45, 2年前 , 5F
絕對難不倒台灣好嗎!
06/30 00:45, 5F

06/30 00:54, 2年前 , 6F
直接用google 也行啊 要開幾台設定一下就好
06/30 00:54, 6F

06/30 01:09, 2年前 , 7F
政府不會把資料放在亞馬遜還是 google 啦
06/30 01:09, 7F

06/30 03:01, 2年前 , 8F
政府會放到中華電信機房
06/30 03:01, 8F
文章代碼(AID): #1WsqinRC (Gossiping)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 58 之 62 篇):
文章代碼(AID): #1WsqinRC (Gossiping)