【導讀】及時預警發(fā)現(xiàn)故障,事后提供翔實的數(shù)據用于追查定位問題。個成熟的運維產品,業(yè)界有很多開源的實現(xiàn)可供選擇。當公司剛剛起步,業(yè)務。時省力,效率最高的方案。之后,隨著業(yè)務規(guī)模的持續(xù)快速增長,監(jiān)控的對象。大為更多的DEVS,SRE。這時候,監(jiān)控系統(tǒng)的容量和用戶的“使用效率”成了。最為突出的問題。監(jiān)控系統(tǒng)業(yè)界有很多杰出的開源監(jiān)控系統(tǒng)。我們在早期,一直在用zabbix,控系統(tǒng)在性能、擴展性、和用戶的使用效率方面,已經無法支撐了。思考出發(fā),設計開發(fā)了小米的監(jiān)控系統(tǒng):open-falcon。open-falcon的目標是做最開放、最好用的互聯(lián)網企業(yè)級監(jiān)控產品。Open-falcon通過十幾個組件結合使用,達到監(jiān)控告警目的。是由于監(jiān)控windows主機時,windows主機的網卡信息很可能有中文。我們使用64位Linux作為開發(fā)環(huán)境,與線上環(huán)境保持一致。每個壓縮包對應一個組件,創(chuàng)建獨立組件目錄,將壓縮包解壓到相應目錄即可。收用戶手工push的一些數(shù)據,然后通過長連接迅速轉發(fā)給Transfer。