[心得] 監控服務 Gatus 系統架構

看板Soft_Job作者 (小惡魔)時間1年前 (2022/07/28 21:37), 編輯推噓3(300)
留言3則, 3人參與, 1年前最新討論串1/1
部落格: https://bit.ly/gatus-blog 投影片: https://bit.ly/gatus-slide 今年第一場公開的演講 2022 台灣雲端大會,台灣五月開始疫情變嚴重,故延遲了一次到 七月才舉辦,這次帶給大家的是『自動化監控網站運行服務 – Gatus』,內容可以拆為 兩個部分,第一部分是介紹為什麼要使用 Gatus,用來解決開發團隊哪些問題,我也整理 了三大點為什麼我選擇 Gatus,另一部分就是本篇的主軸,Gatus 系統架構跟流程。 1. 監控條件 (客製化回應) 2. 開源專案 (Go 語言) 3. 簡易頁面 (Status Page) 對於使用 Gatus 有興趣的朋友可以參考我之前寫的文章:『自動化監控網站運行服務 - Gatus』,本篇就不介紹怎麼使用 Gatus 了。 https://i.imgur.com/bG24JxH.png
看完系統流程後,你一定會問,怎麼確保系統穩定性,可否一次跑兩個或多個 Instance 呢?如果 Endpoint 很多個,會不會有系統不穩定呢?大家可以看看這裡的討論串,由於 架構變動太大,大家只提出自己的想法,最後要實作可能要靠作者,那底下我自己提供一 個解法 https://i.imgur.com/mvEGMva.png
上面架構其實要考慮的層面很多,包含怎麼設計設定檔 (YAML) 等,底下列出 3 大點讓 大家想看看怎麼實作 1. 確保每台 Agent 不會拿到重複 Endpoint 2. 當 Endpoint 有變化時,如何通知 Agent 關閉 3. 處理 Server 及 Agent graceful shutdown 機制 -- AppleBoy Blog: http://blog.wu-boy.com -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.110.136.13 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1659015468.A.B46.html

07/28 23:56, 1年前 , 1F
推!
07/28 23:56, 1F

07/28 23:56, 1年前 , 2F
先推
07/28 23:56, 2F

07/29 10:34, 1年前 , 3F
07/29 10:34, 3F
文章代碼(AID): #1Yuf4ij6 (Soft_Job)