宝塔服务器面板,一键全能部署及管理,送你10850元礼包,点我领取

监控作为最重要的机制之一,在一定程度上被忽视了。

随处可见的灾难、监控系统警告使您有机会快速启动灾难响应计划,或着手排除复杂的性能故障。 这对所有规模的企业都有非常大的价值。

有效的运行监测体系最终得不到相关技术平台的支持,我们需要了解监控技术平台。

在接下来的两节课中,我们将讨论开源工具介绍和商用运维监控系统这两个方面。

让我们详细谈谈开源工具的介绍。

Zabbix

官网: https://www.zabbix.com/

Zabbix是一个企业级开源运输平台,提供基于WEB界面的分布式系统监控和网络监控功能,也是目前国内互联网用户中应用最广泛的监控软件,是云智慧相遇的用户

入门方便、动手简单、功能强大、开源免费是云对Zabbix智慧最直观的评价。 Zabbix管理和配置简单,可以生成比较漂亮的数据图,其自动发现功能大大减少了日常管理的工作量,丰富的数据收集方式和API接口使用户可以灵活地进行数据收集,分布式系统架构更多理论上,Zabbix提供的插件体系结构可以满足企业的所有需求。

可以直接看到这边的zabbix相关板块。 https://www.ABC docker.com/ABC docker/category/zabbix /

用户组: 90%以上的中小型通用互联网公司

优点:

1 .支持多平台的企业级分布式开源监控软件

2 .安装部署简单,多种数据收集插件灵活集成

3 .功能强大,可实现复杂的多条件报警,

4 .带有绘图功能,可以将得到的数据绘制成图形

5 .提供多个支持脚本调用的API接口

6 .出现问题时,可以自动远程执行命令(需要对代理设置执行权限) )。

缺点:

1 .项目批量修改不便

2 .入门简单,可实现基础监控,但深层次需求需要熟悉Zabbix,进行大量二次定制开发,难度较大

3 .系统级报警设置较多,不筛选报警短信较多,定制的项目报警需要自行设置,非常费事。 (但是,相对来说,internet上的模板也可以使用导入模板的方法。 )

4 .在数据聚合功能不足的情况下,无法看到一组服务的平均值,需要进行二次开发

5 .数据报告需要特别的二次发展定义

Nagios

官网: https://www.nagios.org/

Nagios是一个开源企业级监控系统,实现了系统CPU、磁盘、网络等参数的基本系统监控,以及SMTP、POP3、HTTP、NNTP等多种基本服务类型另外,通过安装插件和编写监视脚本,用户可以监视APP应用程序,并为大量监视主机和多个对象部署分层的监视体系结构。

Nagios的最大特点是其强大的管理中心,其功能是监视服务和主机,但Nagios本身不包含这部分功能代码,所有的监视、警告功能都由相关插件完成。

用户组:最适合复杂IT环境的企业

优点:

1 .发生错误的服务、APP应用程序和设备将自动重新启动,并自动滚动日志

2 .灵活配置,自定义shell脚本,在分布式监视模式下

3 .支持冗馀主机监控,报警设置多样

4 .通过命令重新加载配置文件,不需要干扰Nagios的执行

缺点:

1 .事件控制台功能薄弱,插件易用性差

2 .对性能、流量等指标处理不力

3 .看不到历史数据,只能看到报警事件,故障原因跟踪困难

4 .布局复杂,初学者投入的时间、精力、成本大

安格利亚

官网: http://ganglia.info/

Ganglia是由加州大学伯克利分校发起的开源集群监控项目,最初旨在监控成千上万个网络节点。 Ganglia是一个高性能计算系统下的分布式监控系统,可以跨平台扩展。 它广泛地移植到各种操作系统和处理器体系结构中。

用户组:适用于大型服务器集群用户。

优点:

1 .适合监测系统性能,通过曲线方便地看到各节点的工作状态

2 .可以自定义监视项目。 监控展示有表格和图像两种,支持手机版

3 .易于部署,在不同层管理数万台机器,无需单独添加配置

缺点:

1 .没有内置的消息通知系统

2 .无报警机制,出现问题不能及时报警

Grafana

官网: http://grafana.org/

只要是需要数据可视化的地方,Grafana就可以在任何地方使用。 如果有一天老板想让你做

份漂亮的业务数据图表,你无需头疼用什么绘图库去开发,你要做的仅仅是将业务数据稍作加工存入Grafana支持的DataSource,点几下鼠标即可配制出一份完美的数据图表。

因为这款工具除了绘图比较好看,其他的功能不如我们的zabbix。我们这里就简单的说一下,以后会有相关文档,请继续关注abcdocker!

Zenoss

Zenoss Core是Zenoss的开源版本,其商用版本为ZenossEnterprise。作为企业级智能监控软件,Zenoss Core允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core的强大能力来自于深入的列表与配置管理数据库,以发现和管理公司IT环境的各类资产。Zenoss同时提供与CMDB关联的事件和错误管理系统, 以协助提高各类事件和提醒的管理效率。

优点:

1. Zenoss比较出色的地方在于它的Dashboard,可以配置很多portlet

2. 每个用户的界面都是分开管理的,自定义dashboard不会影响其他用户

3. 强大监控功能支持服务器、路由交换、防火墙、存储、数据库、中间件监控

4. 采用基于HBASE的opentsdb存储任意时间段的数据

5. 将状态监控,性能监控,资源管理,良好的报告机制进行有机的整合

缺点:

1. 对资源要求较高,即使只管理少数几台设备,也需要消耗大量硬件及内存等附加资源。

2. 针对windows系统,开源版只提供SNMP,通过WMI检测CPU,Disk,软硬件和性能只在收费版提供。

Open-falcon

Open-falcon是小米运维团队从互联网公司的需求出发,根据多年的运维经验,结合SRE、SA、DEVS的使用经验和反馈,开发的一套面向互联网的企业级开源监控产品。

Open-falcon架构

用户群:目前有几十家企业用户不同程度使用。

优点:

1. 自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持

2. 支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询

3. 高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用

4. 单机支撑200万metric的上报、归档、存储

5. 采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据

6. 多维度的数据展示,用户自定义Screen 7. 通过各种插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交换机监控。

缺点:

由于发布时间较短,很多基础的服务监控插件(如Tomcat、apache等)还不支持,很多功能还在不断完善中,另外由于缺少专门的支持,虽然有开放社区,但是解决问题的效率相对较低。

Cacti

官方网站:http://www.cacti.net

提示:近几年cacti和nagios已经基本被zabbix代替

Cacti 在英文中的意思是仙人掌的意思,Cacti是一套基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具。它通过snmpget来获取数据,使用 RRDtool绘画图形,它的界面非常漂亮,能让你根本无需明白rrdtool的参数能轻易的绘出漂亮的图形。而且你完全可以不需要了解RRDtool复杂的参数。它提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结 构、host以及任何一张图,还可以与LDAP结合进行用户验证,同时也能自己增加模板,让你添加自己的snmp_query和!功能非常强大完善,界面友好。可以说,Cacti将rrdtool的所有“缺点”都补足了!下图是Cacti运行的主界面,

Cacti 工作流程

步骤一,snmp协议收集远程服务器的数据

步骤二,将snmp收集的数据内容保存到rrd数据库中

步骤三,若用户查看某台设备上的流量或其它状态信息 步骤四,在mysql数据库中查找该设备对应的rra数据库文件的名称

步骤五,通过rrdtool命令进行绘图即可

提示:cacti的图确实不好找,只能官网截一个

还有很多不出门的监控工具,这里就不在介绍了。

天兔开源监控(只适用于mysql、redis、oracle)

官方网站:http://www.lepus.cc/   

简洁、直观、强大的开源数据库监控系统,MySQL/Oracle/MongoDB/Redis一站式性能监控,让数据库监控更简单

优点:

中文开源软件,里面监控mysql和redis可以精确到sql语句

缺点:

因为只有监控数据库和非关系数据库,监控项不能统一,不能结合其他监控平台

飞艇稳赚不赔的打法alcon

Open-falcon是小米运维团队从互联网公司的需求出发,根据多年的运维经验,结合SRE、SA、DEVS的使用经验和反馈,开发的一套面向互联网的企业级开源监控产品。

Open-falcon架构

用户群:目前有几十家企业用户不同程度使用。

优点:

1. 自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持

2. 支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询

3. 高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用

4. 单机支撑200万metric的上报、归档、存储

5. 采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据

6. 多维度的数据展示,用户自定义Screen 7. 通过各种插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交换机监控。

缺点:

由于发布时间较短,很多基础的服务监控插件(如Tomcat、apache等)还不支持,很多功能还在不断完善中,另外由于缺少专门的支持,虽然有开放社区,但是解决问题的效率相对较低。

Cacti

官方网站:http://www.cacti.net

提示:近几年cacti和nagios已经基本被zabbix代替

Cacti 在英文中的意思是仙人掌的意思,Cacti是一套基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具。它通过snmpget来获取数据,使用 RRDtool绘画图形,它的界面非常漂亮,能让你根本无需明白rrdtool的参数能轻易的绘出漂亮的图形。而且你完全可以不需要了解RRDtool复杂的参数。它提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结 构、host以及任何一张图,还可以与LDAP结合进行用户验证,同时也能自己增加模板,让你添加自己的snmp_query和!功能非常强大完善,界面友好。可以说,Cacti将rrdtool的所有“缺点”都补足了!下图是Cacti运行的主界面,

Cacti 工作流程

步骤一,snmp协议收集远程服务器的数据

步骤二,将snmp收集的数据内容保存到rrd数据库中

步骤三,若用户查看某台设备上的流量或其它状态信息 步骤四,在mysql数据库中查找该设备对应的rra数据库文件的名称

步骤五,通过rrdtool命令进行绘图即可

提示:cacti的图确实不好找,只能官网截一个

还有很多不出门的监控工具,这里就不在介绍了。

天兔开源监控(只适用于mysql、redis、oracle)

官方网站:http://www.lepus.cc/   

简洁、直观、强大的开源数据库监控系统,MySQL/Oracle/MongoDB/Redis一站式性能监控,让数据库监控更简单

优点:

中文开源软件,里面监控mysql和redis可以精确到sql语句

缺点:

因为只有监控数据库和非关系数据库,监控项不能统一,不能结合其他监控平台