前言
本书由来
“运筹帷幄之中,决胜千里之外。”在IT运维中,监控占据着重要的地位,按比例来算,说占30%一点也不为过。对IT运维工程师来说,构建一个真正可用的监控告警系统是一项艰巨的任务。在监控系统的开源软件中,可供选择的工具众多,然而真正符合需求,能够真正解决业务问题的监控系统软件却凤毛麟角。
笔者在自己的运维从业生涯中用过的监控系统有Cacti、Nagios等,以及笔者公司开发的监控告警系统,直到接触了Zabbix,才发现这个灵活而强大的自动化监控工具正是笔者所寻找的。随着近年来云计算、容器技术的大规模普及,软件架构已经从单体架构走向微服务架构,对监控的灵活性和可靠性的要求越来越高,出现了更多有趣的监控软件,如Prometheus、Influx家族,这些监控软件解决了在当前环境中面临的一些问题,提供了非常优秀的监控解决方案,但这并不妨碍Zabbix的继续流行。从2012年开始,国内Zabbix的用户群体在逐步扩大,当前Zabbix已经成为运维人员必须掌握的技能之一。究其原因,得益于Zabbix灵活的架构设计、极强的扩展能力、丰富的监控能力、易于与外部集成的能力,从硬件监控,到操作系统,再到服务进程,以及网络设备,其无所不能的监控功能令人叹为观止,相信这也是大多数Zabbix爱好者选择它的主要原因。
当然,在Zabbix的使用过程中,会面临上手容易、精通较难的问题,原因在于Zabbix过于灵活,其配置的颗粒度非常细致,这也会让大多数用户刚接触学习它的时候一头雾水,所以查看官方文档和阅读一本相关书籍的学习方式都是明智的选择。
笔者从2012年开始使用Zabbix,曾公开自己的使用文档,很高兴文档对不少初学Zabbix的朋友有所帮助,但随着向笔者咨询问题的人数增多,其中多数问题是重复的,且笔者解答问题的精力有限,于是萌生出书的想法,在其后的2014年,正式出版了《Zabbix企业级分布式监控系统》一书,并被广大Zabbix爱好者喜爱。时光荏苒,2018年,Zabbix 4.0版本正式发布,所以本书也需要升级换代,在此情况下,笔者对书籍内容进行了大幅度的重构,并对书籍的内容和深度进行了扩展,让本书可以真正成为Zabbix用户的案头首选参考书。本书得以改版,我们的编辑付睿老师功不可没,在2016—2017年的时候,她一直催促笔者更新内容。由于笔者当时是被动更新的,并没有想好新加什么内容,并且笔者基于原有书稿做了一些更新,但内容无法令自己满意,于是就没有继续下去,当时Zabbix是3.0版本。直到2018年,笔者觉得是时候更新内容了。