zabbix触发器标签提取监控项子字符串功能实现对应告警恢复
张三 2023-09-27 20:23:54 2023-09-27 0 0
0 背景介绍
系统版本
zabbix 6.0
实验场景
假设已实现某集群系统日志监控,内容如下:

1 监控项
1.1 监控项设置(模拟)
通过zabbix agent自定义监控项,读取某文件内容模拟日志/trap告警,测试获取触发器标签中提取子字符串功能,以及相同标签的触发器自动恢复功能。

1.2 文件内容
文件中写入如下内容,意为集群中node-01主机离线。
07:28:29 2023/08/03 AlertLevel:major AlertResourceType:host AlertHostName:node-01 AlertValue:offline
2 触发器
2.1 触发器设置
2.2 标签设置
{{ITEM.VALUE}.iregsub("AlertHostName:(\S+)","\1")}
3 测试
3.1 node-01离线
手工执行监控项,模拟node-01节点离线,此时可以看出已经产生标签,标签名为AlertHostName,标签值为node-01

3.1 node-02上线
修改文本内容如下,意为node-02节点上线,并手工执行。
07:28:29 2023/08/03 AlertLevel:major AlertResourceType:host AlertHostName:node-02 AlertValue:online
此时AlertHostName标签为node-02,因和node-01不匹配,因此告警无法恢复。
3.2 node-01上线
修改文本内容如下,意为node-01节点上线,并手工执行。
07:28:29 2023/08/03 AlertLevel:major AlertResourceType:host AlertHostName:node-01 AlertValue:online
此时因为AlertHostName标签值一致,告警得以恢复
