基于prometheus的云監(jiān)控告警方案為五星云站全站提供智能報(bào)警
傳統(tǒng)的監(jiān)控警告初次使用需要大量配置,而且隨著服務(wù)器和業(yè)務(wù)的增長(zhǎng)會(huì)發(fā)現(xiàn)面臨很多問(wèn)題,比如DB性能瓶頸;多套部署,管理成本高;配置和管理非常復(fù)雜,易用性差;郵件配置各種規(guī)則相當(dāng)復(fù)雜,一不小心可能就容易造成郵件風(fēng)暴的問(wèn)題等。
五星云站中使用了基于prometheus的云監(jiān)控告警方案,具有以下優(yōu)勢(shì):
1.縮短流程。老系統(tǒng)要增加機(jī)器需要提前申請(qǐng),而使用 Kubernetes 容器平臺(tái)只要整個(gè)資源池里有充足的資源,不用提交預(yù)算就可以直接使用。
2. 彈性擴(kuò)容。在流量高峰期,容器平臺(tái)可以快速擴(kuò)容;在流量不多的時(shí)段,空閑的資源可以處理其他離線(xiàn)任務(wù),對(duì)資源的利用率高。
3.高可用。容器平臺(tái)可以保證運(yùn)行的服務(wù)數(shù)量總是能達(dá)到預(yù)期。
4.減輕運(yùn)維負(fù)擔(dān)。之前所有的部署上線(xiàn)活動(dòng)都是運(yùn)維來(lái)做。容器平臺(tái)上線(xiàn)后,開(kāi)發(fā)人員可以直接在程序完成之后將其制作成鏡像,自己就可以進(jìn)行部署。