運維監控工具千千萬,僅開源的解決方案就有流量監控(MRTG、Cacti、SmokePing、Graphite 等)和性能告警(Nagios、Zabbix、Zenoss Core、Ganglia、OpenTSDB等)可供選擇。
并且每種軟件都有自己的特點和功能,各自的側重點和目標不完全相同,在設計理念和實現方法上也大同小異,但都具有共同特征。例如,采集數據、分析展示、告警以及簡單的故障自動處理。最終都能達到對 IT 系統服務可用性的一個完全展示。
下面我們將針對目前行業內常用的五種監控工具(Cacti、Nagios、Zabbix、Grafana、Prometheus)詳細介紹各自的特點。
1、Cacti
Cacti(英文含義為仙人掌)是一套基于 PHP、MySQL、SNMP 和 RRDtool開發的網絡流量監測圖形分析工具。
它通過 snmpget 來獲取數據,使用 RRDtool 繪圖,但使用者無須了解 RRDtool 復雜的參數。它提供了非常強大的數據和用戶管理功能,可以指定每一個用戶能查看樹狀結構、主機設備以及任何一張圖,還可以與 LDAP 結合進行用戶認證,同時也能自定義模板,在歷史數據的展示監控方面,其功能相當不錯。
Cacti 通過添加模板,使不同設備的監控添加具有可復用性,并且具備可自定義繪圖的功能,具有強大的運算能力(數據的疊加功能)。
2、Nagios
Nagios 是一個企業級的監控系統,可監控服務的運行狀態和網絡信息等,并能監視所指定的本地或遠程主機參數以及服務,同時提供異常告警通知功能等。
Nagios 可運行在 Linux 和 UNIX 平臺上,同時提供一個可選的基于瀏覽器的Web 界面,以方便系統管理人員查看網絡狀態、各種系統問題,以及日志等。Nagios 的功能側重于監控服務的可用性,能及時根據觸發條件告警。
目前,Nagios 也占領了一定的市場份額,不過從觀察來看,Nagios 并沒有與時俱進,已經不能滿足于多變的監控需求,架構的擴展性和使用的便捷性有待增強,其高級功能集成在商業版 Nagios XI 中。
3. Zabbix
Zabbix 是一個分布式監控系統,支持多種采集方式和采集客戶端,有專用的Agent(代理),也可以支持 SNMP、IPMI、JMX、Telnet、SSH 等多種協議,它將采集到的數據存放到數據庫,然后對其進行分析整理,達到條件觸發告警。
Zabbix擁有良好的擴展性,同時它的功能十分豐富,可以監控CPU負荷、內存使用、磁盤使用、網絡狀況、端口監視、日志監視等。
但是因為消耗資源較多的緣故,如果監控的主機非常多時,可能會出現監控超時、告警超時等現象。
4、Prometheus
Prometheus 作為一個數據監控解決方案,它由一個大型社區支持,有來自700多家公司的6300個貢獻者,13500個代碼提交和7200個拉取請求。
Prometheus具有以下特性:
多維的數據模型(基于時間序列的Key、Value鍵值對)
靈活的查詢和聚合語言PromQL
提供本地存儲和分布式存儲
通過基于HTTP的Pull模型采集時間序列數據
可利用Pushgateway(Prometheus的可選中間件)實現Push模式
可通過動態服務發現或靜態配置發現目標機器
支持多種圖表和數據大盤
5、Grafana
Grafana 是一款采用 go 語言編寫的開源應用,主要用于大規模指標數據的可視化展現。
Grafana支持許多不同的數據源。每個數據源都有一個特定的查詢編輯器,該編輯器定制的特性和功能是公開的特定數據來源。官方支持以下數據源:Graphite,Elasticsearch,InfluxDB,Prometheus,Cloudwatch,MySQL和OpenTSDB等。
每個數據源的查詢語言和能力都是不同的。你可以把來自多個數據源的數據組合到一個儀表板,但每一個面板被綁定到一個特定的數據源,它就屬于一個特定的組織。
最后
每個監控工具的優勢和能力都是不同的。你可以根據實際應用需求,選擇適合的監控工具。
編輯:lyn
-
監控
+關注
關注
6文章
2219瀏覽量
55282 -
IT
+關注
關注
2文章
866瀏覽量
63574 -
PHP
+關注
關注
0文章
454瀏覽量
26721
原文標題:這5種常用運維監控工具都不會用,還算什么運維人?
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論