zabbix一直误报的问题通过网站ping检测测求助

您所在的位置: &
电子工业出版社
《Zabbix监控系统》第2章数据采集方法介绍,本章我们对Zabbix系统中可使用的多达10多种监控数据采集方法的原理、相关的周边知识及与之相关的Zabbix服务器和客户端配置等逐一做了介绍。本节为大家介绍简单检查。
2.2& 简单检查
正如简单检查(Simple Check)这种监控数据采集方法的名字所揭示的那样,这种监控数据采集方法是指Zabbix服务器(也包括Zabbix服务器代理)自身通过一定的方式或方法检查被监控设备上的网络端口状态或ICMP的信息,从而获取监控数据的一种监控数据采集方法。
在Zabbix系统的简单检查中,ping检查需要安装第三方工具包--fping。如果没有安装这个软件包,或者fping命令的权限设置不正确,或者Zabbix服务器端(或Zabbix服务器代理)的配置文件中所指定的fping命令路径(通过配置文件中的FpingLocation配置项来指定)与fping命令的实际安装路径不一致,那么简单检查方法中的ping功能(包括icmpping、icmppingloss和icmppingsec)都将无法使用。
运行Zabbix服务器端和其代理进程的系统用户,通常用户名为zabbix,其需要对fping命令具有可执行权限,而且fping命令需要针对root用户设置setuid权限位。对fping命令设置权限的命令如下:
shellchown&root:zabbix&/usr/local/sbin/fping &shellchmod&4710&/usr/local/sbin/fping&
与通过被监控设备代理采集监控数据的方法类似,通过简单检查的方法所能采集监控数据的监控项目的种类也是相对固定的。这是因为,如前文所述,通过简单检查的方法采集监控数据需要使用第三方工具--fping,而很显然,该工具所支持的功能和可传递的参数是相对固定的。表2-1列出了Zabbix系统所支持的、可通过简单检查的方法采集监控数据的监控项目种类信息。
表2-1& 简单检查类监控项目列表
提示:1. 何为监控项目的关键字以及它们的作用,我们在后续章节中有详细介绍。
2.监控项目关键字中的参数可以省略。但是,在第一个未省略的参数之前,如有参数被省略了,那么分隔该被省略参数的&,&号必须要有。但是,最右边连续被省略的参数,可以不需要填写相应的&,&号。
3. 你或许觉得service参数的可选值中所列的这些应用层服务,其在网络层协议上均是基于TCP协议的。那么,既然Zabbix系统可以直接检测tcp服务的状态和性能,那为什么还需要单独对SSH、FTP等服务进行检测呢?实际上,对于像SSH、FTP、SMTP等应用层服务,直接通过TCP服务并根据相应端口号也是可以检测的。但是,某些应用层服务,对客户端连接是否成功的响应是有固定特征码的。例如,POP3服务,对客户端成功连接的响应特征码是&OK&;而SMTP服务,对客户端成功连接的响应特征码是&220&。这样,在service参数中使用更确切的服务名称,将会使检测的结果更加准确。
4.Zabbix系统每次执行单项简单检查的最长时间,不会超过Zabbix服务器(或Zabbix服务器代理)端组件所对应的配置文件中相关配置项所指定的超时时间,因此,表2-1中timeout参数所指定的超时时间不应超过Zabbix服务器(或Zabbix服务器代理)端配置文件中所指定的超时时间。
我们知道,在Zabbix系统的简单检查中,ping检查需要使用到第三方命令工具--fping。不难理解,在Zabbix系统调用fping命令工具时,一般不会也没有必要将fping命令工具所支持的所有参数都显式地传递给它,对于一些非关键的、可以使用默认值的参数,Zabbix系统在调用fping命令工具时就不会显式地传递给它。同时,对于某些用户在监控项目的配置中没有显式指定的参数,Zabbix系统在调用fping命令工具时,也可能会使用自身设定默认值作为调用fping命令工具时的参数值传递给fping命令工具。需要提醒注意的是,fping命令工具参数的默认值和Zabbix系统调用fping命令工具时所使用的参数默认值不是一码事。前者是指,Zabbix系统在调用fping命令工具时没有显式地指定某个参数的值,此时fping命令工具会使用相应参数的默认值来执行;而后者则是指,当用户在监控项目的配置中没有显式地指定某个参数时,Zabbix系统会使用自身设定的该参数的默认值来调用fping命令工具。表2-2列出了这两类默认值的信息。需要说明的是,某些参数的默认值可能会随着安装fping工具的平台及版本的不同而不同。
表2-2& fping命令参数默认值列表
喜欢的朋友可以添加我们的微信账号:
51CTO读书频道二维码
51CTO读书频道活动讨论群:【责任编辑: TEL:(010)】&&&&&&
关于&&&&的更多文章
Zabbix能监视各种网络参数,保证服务器系统的安全运营,并提供柔
本书描述了黑客用默默无闻的行动为数字世界照亮了一条道路的故事。
讲师: 22人学习过讲师: 7人学习过讲师: 12人学习过
《移动学习:引爆互联网学习的革命》为研发、评估和集
《闲话IT项目管理》主要介绍IT 项目经理承担本职工作
《玩"赚"社交营销》是一本社交商务营销图书,主要讲述
本书是Inside Microsoft SQL Server 2005系列四本著作中的一本。它详细介绍了T-SQL的内部构造,包含了非常全面的编程参考。它提
51CTO旗下网站首页 & 开源软件zabbix小结(七)触发器相关 zabbix trigger是zabbix 进行告警通知的设定条件 ,当监控获取的值触发了设定的条件时,会按照触发器的设定,执行相应的action 操作 。在zabbix中为了比较方便的设定各种条件,zabbix为我们设计了相应的函数和操作符 。本篇就重点介绍下trigger的函数相关的内容。 一、创建触发器 触发器可以是和模板关联的,也可以是和主机关联的。即在创建模板时,就设定好相应的触发器,和模板相关联的主机同时也关联了触发器,一旦条件满足就执行相应的操作(如告警),我们可以认为他是全局性的;和主机关联的触发器是属于局限性的触发器,该触发只针对特别设定的主机有效,对其他主机无效。 针对全局性触发器和局限性触发器的不同,所以其可以在configuration 下的hosts 里配置trigger ,也可以在 configuration 下的tmplates 里配置 trigger。无论在那一处配置,其界面都是类似如下:
如上图所示,通过设置name、条件、描述、告警级别等保存并启用即可完成一个触发器的新增。 二、触发器表达式 触发器的表达式即上面的expression里填写的内容,其格式为:{&server&:&key&.&function&(&parameter&)}&operator&&constant& 以上面的截图为例,key为icmppingloss ,function函数是min ,parameter参数值为5分钟 ,运算符是大于 。 1、时间参数 zabbix 触发条件里,很多是对单位时间内的数字参数进行表达式表达的,其中涉及到的常用时间单位如下:s - seconds (when used, works the same as the raw value)
m - minutes
w - weeks 2、运算符 运算符对应表达式中的operator部分,可以使用的操作符有: PRIORITY OPERATOR DEFINITION 1 / Division 2 * Multiplication 3 - Arithmetical minus 4 + Arithmetical plus 5 & Less than. The operator is defined as: A&B
(A&=B-0.000001) 6 & More than. The operator is defined as: A&B
(A&=B+0.000001) 7 # Not equal. The operator is defined as: A#B
(A&=B-0.000001) | (A&=B+0.000001) 8 = Is equal. The operator is defined as: A=B
(A&B-0.000001) & (A&B+0.000001) 9 & Logical AND 10 | Logical OR 示例:{:system.cpu.load[all,avg1].last(0)}&5
#系统负载大于5
{:system.cpu.load[all,avg1].last(0)}&5|{:system.cpu.load[all,avg1].min(10m)}&2
#cpu负载大于5或者最后10分钟负载大于2的时候都会报警。
{:vfs.file.cksum[/etc/passwd].diff(0)}&0
#/etc/passwd文件改变会报警
{:net.if.in[eth0,bytes].min(5m)}&100K
#在最后5分钟,网卡eth0的流量大于100K报警
{:net.tcp.service[smtp].last(0)}=0&{:net.tcp.service[smtp].last(0)}=0
#两个节点上的smtp服务都宕机才会报警,该表达式用了两个主机
{:icmpping.count(30m,0)}&5
#在最后30分钟主机不能ping通的次数大于5就报警
{server:system.cpu.load.avg(1h)}/{server:system.cpu.load.avg(1h,1d)}&2
({TRIGGER.VALUE}=0&{server:temp.last(0)}&20)|
({TRIGGER.VALUE}=1&{server:temp.last(0)}&15)以上参考官方文档 。 三、表达式函数 表达式函数也算是表达式中的一部分,不过内容比较多,这里单独拿出来总结 。 abschange 参数:忽略 支持类型:float,int,str,text,log 作用:返回最近获得的值与之前获得值差的绝对值,对于字符串类型:0表示相等,1表示不同 avg 参数:秒或#num 支持类型:float,int 作用:返回一段时间的平均值 举例: avg(5):最后5秒的平均值 avg(#5):表示最近5次得到值的平均值 avg():表示一天前的一个小时的平均值 如果仅有一个参数,表示指定时间的平均值,从现在开始算起,如果有第二个参数,表示漂移,从第二个参数前开始算时间, #n表示最近n次的值 max 参数:秒或#num 支持值类型:float,int 描述:返回指定时间间隔的最大值.时间间隔作为第一个参数可以是秒或收集值的数目(前缀为#).从Zabbix1.8.2开始,函数支持第二个可选参数time_shift,可以查看avg()函数获取它的使用方法. min 参数:秒或#num 支持值类型:float,int 描述:返回指定时间间隔的最小值.时间间隔作为第一个参数可以是秒或收集值的数目(前缀为#).从Zabbix1.8.2开始,函数支持第二个可选参数time_shift,可以查看avg()函数获取它的使用方法. sum 参数:秒或#num 支持值类型:float,int 描述:返回指定时间间隔中收集到的值的总和.时间间隔作为第一个参数支持秒或收集值的数目(以#开始).从Zabbix1.8.2开始,本函数支持time_shift作为第二个参数。可以查看avg函数获取它的用法 change 参数:忽略 支持类型:float,int,str,text,log 作用:返回最近获得值与之前获得值的差值,对于字符串0表示相等,1表示不同 举例: change(0)&n:忽略参数一般输入0,表示最近得到的值与上一个值的差值大于n count 参数:秒或#num 支持类型:float,int,str,text,log 作用:返回指定时间间隔内数值的统计, 举例:count(600)最近10分钟得到值的个数
count(600,12)最近10分钟得到值的个数等于12
count(600,12,"gt")最近10分钟得到值的个数大于12
count(#10,12,"gt")最近10个值中,值大于12的个数
count(600,12,"gt",86400)24小时之前的10分钟内值大于12的个数
count(600,6/7,"band")-thenumberofvaluesforlast10minuteshaving'110'(inbinary)inthe3leastsignificantbits.
count(600,,,86400)24小时之前的10分钟数据值的个数 第一个参数:指定时间段 第二个参数:样本数据 第三个参数:操作参数 第四个参数:漂移参数#支持的操作类型
ne: 不相等
ge: 大于等于
le: 小于等于
like: 内容匹配 diff 参数:忽略 支持值类型:float,int,str,text,log 作用:返回值为1表示最近的值与之前的值不同,0为其他情况 last 参数:秒或#num 支持值类型:float,int,str,text,log 作用:最近的值,如果为秒,则忽略,#num表示最近第N个值,请注意当前的#num和其他一些函数的#num的意思是不同的 例子: last(0)等价于last(#1)
last(#3)表示最近第3个值(并不是最近的三个值)本函数也支持第二个参数time_shift,例如last(0,86400)返回一天前的最近的值 如果在history中同一秒中有多个值存在,Zabbix不保证值的精确顺序 #num从Zabbix1.6.2起开始支持,timeshift从1.8.2其开始支持,可以查询avg()函数获取它的使用方法 logeventid 参数:string 支持值类型:log 描述:检查最近的日志条目的EventID是否匹配正则表达式.参数为正则表达式,POSIX扩展样式.当返回值为0时表示不匹配,1表示匹配。该函数从Zabbix1.8.5起开始支持. logseverity 参数:忽略 支持值类型:log 描述:返回最近日志条目的日志等级(logseverity).当返回值为0时表示默认等级,N为具体对应等级(整数,常用于Windowseventlogs).Zabbix日志等级来源于Windowseventlog的Information列. logsource 参数:string 支持值类型:log 描述:检查最近的日志条目是否匹配参数的日志来源.当返回值为0时表示不匹配,1表示匹配。通场用于Windowseventlogs监控.例如logsource["VMWareServer"] prev 参数:忽略 支持值类型:float,int,str,text,log 描述:返回之前的值,类似于last(#2) regexp 参数:第一个参数为string,第二个参数为秒或#num 支持值类型:str,log,text 描述:检查最近的值是否匹配正则表达式,参数的正则表达式为POSIX扩展样式,第二个参数为秒数或收集值的数目,将会处理多个值.本函数区分大小写。当返回值为1时表示找到,0为其他. str 参数:第一个参数为string,第二个参数为秒或#num 支持值类型:str,log,text 描述:查找最近值中的字符串。第一个参数指定查找的字符串,大小写敏感。第二个可选的参数指定秒数或收集值的数目,将会处理多个值。当返回值为1时表示找到,0为其他. strlen 参数:秒或#num 支持值类型:str,log,text 描述:指定最近值的字符串长度(并非字节),参数值类似于last函数.例如strlen(0)等价于strlen(#1),strlen(#3)表示最近的第三个值,strlen(0,86400)表示一天前的最近的值.该函数从Zabbix1.8.4起开始支持 time 参数:忽略 支持值类型:any 描述:返回当前时间,格式为HHMMSS,例如123055 date 参数:忽略 支持类型:any 作用:返回当前的时间,格式YYYYMMDD dayofmonth 返回当前是本月的第几天 dayofweek 返回当前是本周的第几天 delta 参数:秒或#num 支持类型:float,int 作用:返回时间间隔内的最大值与最小值的差值 nodata 参数:秒 支持值类型:any 描述:当返回值为1表示指定的间隔(间隔不应小于30秒)没有接收到数据,0表示其他. now 参数:忽略 支持值类型:any 描述:返回距离Epoch(日00:00:00UTC)时间的秒数 fuzzytime 参数:秒 支持值类型:float,int 作用:返回值为1表示监控项值的时间戳与ZabbixServer的时间多N秒,0为其他.常使用system.localtime来检查本地时间是否与Zabbixserver时间相同. 函数部分同样可以参看官方页面 。
本站的发展离不开您的资助,金额随意,欢迎来赏!
分类: 开源软件 monitor, zabbix您可能也喜欢RHEL7性能监控之pcp smokeping告警配置 nginx+smokeping安装配置 Linux atop监控工具部署 linux-dash web监控系统的安装 (2)捐助本站
如您感觉本博客有用,可扫码向本博客捐赠近期文章 win+python+selenium实现窗口和tab切换 Python win32gui调用窗口到最前面 windows下使用python发送控制键 Python+selenium启动浏览器Firefox\Chrome\IE awk排除某列输出文章归档 文章归档 选择月份 2016年八月 &(5) 2016年七月 &(3) 2016年六月 &(6) 2016年五月 &(12) 2016年四月 &(5) 2016年三月 &(2) 2016年二月 &(2) 2016年一月 &(5) 2015年十二月 &(7) 2015年十一月 &(9) 2015年十月 &(7) 2015年九月 &(8) 2015年八月 &(22) 2015年七月 &(10) 2015年六月 &(15) 2015年五月 &(23) 2015年四月 &(13) 2015年三月 &(22) 2015年二月 &(15) 2015年一月 &(24) 2014年十二月 &(12) 2014年十一月 &(15) 2014年十月 &(19) 2014年九月 &(18) 2014年八月 &(18) 2014年七月 &(20) 2014年六月 &(21) 2014年五月 &(24) 2014年四月 &(14) 2014年三月 &(29) 2014年二月 &(22) 2014年一月 &(22) 2013年十二月 &(24) 2013年十一月 &(20) 2013年十月 &(18) 2013年九月 &(16) 2013年八月 &(16) 2013年七月 &(20) 2013年六月 &(21) 2013年五月 &(19) 2013年四月 &(18) 2013年三月 &(21) 2013年二月 &(17) 2013年一月 &(18) 2012年十二月 &(24) 2012年十一月 &(18) 2012年十月 &(17) 2012年九月 &(17) 2012年八月 &(18) 2012年七月 &(26) 2012年六月 &(36) 2012年五月 &(36) 2012年四月 &(28) 2012年三月 &(46) 2012年二月 &(23) 2012年一月 &(14) 2011年十二月 &(27) 2011年十一月 &(59) 2011年十月 &(19) 2011年九月 &(16) 2011年八月 &(46)wdclswt 的BLOG
用户名:wdclswt
文章数:73
评论数:137
访问量:112846
注册日期:
阅读量:5863
阅读量:12276
阅读量:334346
阅读量:1039316
51CTO推荐博文
作用:为了防止zabbix&server因意外原因不能工作,导致管理员没有收到报警邮件而不知道zabbix&server是否运行正常,利用心跳检测来监控zabbix&server本身的运行状态。1、给Zabbix server添加一个Item& & 该Item主要作用是监控zabbix_server服务的默认端口10051或者zabbix_agentd的端口10050:2、添加触发器& &跟以往的触发器不一样,这里设置的是当端口状态正常(listen)时触发: &3、添加动作(1)把默认的内容删除,设置如下,不用勾上恢复项:(2)设置动作的条件,指定触发器状态为OK时执行动作:(3)设置动作详细& & 说明:以往的step设置是from 1 to 1表示只在触发器触发的第一次执行动作,而这里from 1 to 0表示间隔一定时间执行动作,一直这样执行下去。4、查看触发器状态& & 由于10055端口不存在,因此状态为PROBLEM:5、修改Item& & 将端口修改成10050或者10051,使其触发器跳变到OK,从而触发动作的执行:6、触发动作后查看邮件& & Zabbix本身默认的邮件报警动作会发送触发器的故障和恢复邮件,本例设置的动作执行成功则会另发一封心跳检测邮件,标题就是前面设置的"Zabbix Server is running":7、观察心跳检测结果& & 为了更好的检查效果,将动作中的时间间隔设为1分钟,可以看到邮件接收效果:& & && & 结论:如果先设置触发器返回OK状态再设置Action,是不会发送邮件的,只有当触发器从PROBLEM跳变为OK时,才会触发动作;默认的动作是只在状态转换时发送一次邮件通知,心跳检测动作是可以按间隔时间一直发送的,这样就可以通过手机接收邮件,随时关注监控服务器是否运行正常。本文出自 “” 博客,请务必保留此出处
了这篇文章
类别:┆阅读(0)┆评论(0)
09:11:56 09:33:58&&国之画&&&&&&
&& &&&&&&&&&&&&&&&&&&
鲁ICP备号-4
打开技术之扣,分享程序人生!

我要回帖

更多关于 ping检测工具 的文章

 

随机推荐