从零开始构建云平台监控(三)配置基础监控平台

环境:
3台控制节点+2台融合节点 2个osd

给zabbix-server导入模板

模板为分别对应为control、compute、ceph


导入这3个模板

配置自动注册

自动注册就是zabbix-server根据zabbix-agent里面配置的HostMetadata参数的值去进行一系列的操作,和自动发现不一样的是,自动发现只能跟据zabbix-server配置的扫描的网段去添加机器,非常不灵活,并且这个操作是zabbix-server发起的机器规模一大,对zabbix-server有很大的负载压力。自动注册是agent端主动将HostMetadata参数的值给server,server根据管理员的配置在做出相应的操作,在这里比如我openstack的控制节点我就在agent端的HostMetadata配置openstack_controler、然后计算节点配置openstack_computer、存储节点openstack_storager、计算和存储融合节点为 openstack_computer&storager,然后在zabbix-server端创建相应的动作如下图(以添加control为例)其他类似。

操作都填写这些


最后

配置zabbix-agent在agent端安装zabbix-agent,并导入脚本

下载zabbix-agent,agent端就不用源码安装了,直接下载rpm包。

1
wget http://repo.zabbix.com/zabbix/3.4/rhel/7/x86_64/zabbix-agent-3.4.2-1.el7.x86_64.rpm

安装

1
2
3
4
5
6
7
8
9
10
11
[root@node-6 ~]# rpm -ivh zabbix-agent-3.4.2-1.el7.x86_64.rpm
vim /etc/zabbix/zabbix.conf
PidFile=/var/run/zabbix/zabbix_agentd.pid
LogFile=/var/log/zabbix/zabbix_agentd.log
LogFileSize=0
Server=10.10.1.100
ListenPort=10050
ServerActive=10.10.1.100
HostMetadata=openstack_controler
Timeout=15
Include=/etc/zabbix/zabbix_agentd.d/*.conf

解压

1
2
3
tar -xvf controller.agent.tar.gz -C /etc/zabbix/
[root@node-6 zabbix_agentd.d]# chown zabbix:zabbix *
[root@node-6 zabbix_agentd.d]# chmod a+x *

cd /etc/zabbix/script
[root@node-6 script]# chown zabbix:zabbix *
其他几个节点一样

注意两个融合节点metadata配置
HostMetadata=openstack_computer&storager
重启zabbix-agent,等待自动注册。

1
2
systemctl restart zabbix-agent
systemctl enable zabbix-agent

可以看见机器都自动注册进来了。

配置邮件告警

脚本配置

将发送邮件脚本放置到
/usr/local/etc/zabbix/alertscripts

vim sendmail.py

chmod a+x sendmail.py

zabbix-server web端配置

创建报警媒介类型

名字、类型、注意下面三个参数要传递到脚本里面。

配置用户

报警媒介

输入联系人

更新

创建动作,zabbix在3.4.2版本中对创建动作这块有较大改动,多了确认操作,以前只有故障和恢复时发邮件,触发动作的条件可以自己配置。

添加新的动作

添加用户、添加组、选择刚刚创建的发送媒介

恢复操作通知。

测试将zabbix-agent关闭等待5分钟。动作日志。