分类目录归档:监控告警

nagios配置进阶


一、nagios在整个service配置过程中需要重点配置的选项主要包含下面几个:
normal_check_interval    5 ; 服务检查时间间隔,单位是分钟(正常情况下和异常情况下,HARD state)
max_check_attempts       3 ; 异常服务的最大检查次数
retry_check_interval     2 ; 重试检查时间间隔,单位是分钟(没达到最大检查次数情况,不确定异常)
notification_interval    2 ; 通知间隔:再次发出通知的时间,单位是分钟
contact_groups      admins ; 告警通知的联系

Read more

snmp监控简单使用


一、安装snmp:

# yum install -y net-snmp net-snmp-devel net-snmp-libs net-snmp-perl net-snmp-utils mrtg
# yum install gcc

修改配置文件将配置文件修改成下面的参数Sec.name是定义的别名,在后面的组中使用,组要用来赋予权限,是只读还是读写,source是允许那个地址来连接你的snmp,我现在写的这个是允许172.21.0.88这个地址来连接,如果你需要使用一个网段的话,那么就可以这么写了172.21.0.0/24,community是共同体的名称,你用client连接snmp使

Read more

nagios奇怪的错误


昨晚Nagios部分Service报错“connection reset by peer”,Service一会正常一会报错,并且错误数量一致固定。
今天早上错误变为“CHECK_NRPE: Error - Could not connect to . Check system logs on ”。
经检查发现:“Active Checks”被设置为了“Disabled”,改为“Enabled”即解决。

深刻的教训:如遇到服务奇怪的错,先检查Service的状态。

Service的状态:

Read more