Re: [新聞] 資訊龐大 簡訊實聯制疫調無用
: 當初規畫時應該很趕,但沒關係,反正DB就是先開一個table存了再說,然後基本就四個
: 欄位:
: 「流水號(自動編號)、場所代碼、手機號碼、時間」。
: 而且這個table只增不刪。
: 累積幾十億筆都沒關係,反正也算是有基本的結構化不是嗎?
: 以後需要,再看用什麼高超、快速的技術去select,分析用 group by 就好了不是嗎?
: 還是table其實是有開,只是量大到撈不出來嗎?
大致上主table這樣設計,再多加一個場所的table對應場所代碼就可以了。
以資料量來說,前面可以放個一般的資料庫系統,每天晚上在把一天的資料量存到分散式
的dataware house用來作日後的疫調分析
以台灣人口加上店鋪數量來說,只要電話號碼sharding跟partition弄好,店鋪資料應該沒
這麼多,可以直接每一個伺服器都存一份,這樣分析起來應該速度就慢不到哪裡去了。
不知道亞馬遜的雲端服務有沒有開到台灣,不然也可以找他們合作特製一下政府用的私有
雲也可以,還省下了硬體維護的成本。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.13.253.175 (美國)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1624984369.A.6CC.html
推
06/30 00:33,
2年前
, 1F
06/30 00:33, 1F
→
06/30 00:36,
2年前
, 2F
06/30 00:36, 2F
→
06/30 00:37,
2年前
, 3F
06/30 00:37, 3F
→
06/30 00:44,
2年前
, 4F
06/30 00:44, 4F
→
06/30 00:45,
2年前
, 5F
06/30 00:45, 5F
推
06/30 00:54,
2年前
, 6F
06/30 00:54, 6F
→
06/30 01:09,
2年前
, 7F
06/30 01:09, 7F
推
06/30 03:01,
2年前
, 8F
06/30 03:01, 8F
討論串 (同標題文章)