A-A+

HPUX安装nagios监控插件(NRPE)难点解析

2015年11月26日 站长资讯 暂无评论

HPUX上安装NRPE,特别是在监控ORACLE数据库有一些疑难的点,自己一边摸索一边整理了出来,就当是做个备忘

一、下载预编译好的depot源码包

网址:http://www.mayoxide.com/naghpux

包名:NRPE-2.12.depot.gz

可能还需要另外两个包的支持,如果操作系统没有安装,也请下载:

openssl-1.0.1f-ia64-11.31.depot.gz

tcp_wrappers-7.6-ia64-11.31.depot.gz

二、创建NRPE用户

groupadd -g 312 nrpe

useradd -g nrpe -G oinstall -u 312 nrpe (注:之所以添加到oinstall组,是使其具备执行oracle插件的权限)

三、HPUX上安装NRPE

swinstall -s /tmp/NRPE-2.12.depot.gz

swlist -l product | grep NRPE

四、将NRPE配置为inetd管理进程

/opt/nrpe/bin/configure.sh

会在/etc/services与/etc/inetd.conf文件中添加nrpe相关的配置项

五、修改NRPE主配置文件

vi /opt/nrpe/etc/nrpe.conf

主要修改两个地方:

1、allowed_hosts=127.0.0.1,nagios_server_ip

2、command[check_users]=/opt/nrpe/libexec/check_users -w 5 -c 10 (添加监控命令)

六、启动NRPE

inetd -k && inetd  (作为inetd后台服务启动)

七、测试NRPE

/usr/local/nagios/libexec/check_nrpe -H xxxxxx

NRPE v2.12

返回上信息测试成功,在服务端同样测试

netstat -na | grep 5666

查看nrpe服务端口

安装过程中常见疑难解答:

其实nrpe安装很简单,但针对ORACLE数据库的检查(check_oracle),有可能会出现一些问题,这里整理了下:

1、nagios服务端check_nrpe -H nagios_client_IP时提示ssl连接错误?

可能原因:

a、检查nagios_client的nrpe.cfg配置文件,allowed_hosts有没有正确添加服务端的IP;

b、检查openssl包有没有装上;

c、检查服务器之间的防火墙有没有放通5666端口;

2、在hpux服务器上测试check_oracle --cache orcl username password总是提示用户名密码错误,无论用什么帐户都报这个错误?可能原因:

a、一定要注意hpux上输入oracle相关用户名密码进分别用单引号引起来,如'username' 'password'

3、在hpux服务器上测试check_oracle --login check_oracle --cache 都可以正常返回数据,但在nagios服务端总是没有数据返回,但nrpe通信又是正常的,users,disk,load等都可以正常返回数据?

可能原因:

a、遇到这个问题,最好的测试方法是在nrpe.cfg的中相关监控项目后加上 >> /tmp/output 2>&1 将输出结果输入一个文件,方便查看;

b、一些库文件找不到,如utils,这个文件在/opt/nrpe/libexec目录下有,但系统会自动到/目录下查找,只要做个软连接就可以了

ln -s /opt/nrpe/libexec/utils.sh /utils.sh

c、提示ps,grep,awk等命名找不到,这当然是环境变量中没有添加相应命名的路径,把/usr/bin这个目录加到PATH

d、提示su:sorry,主要是执行sqlplus操作需要具有oracle用户的相关权限,只需要将nrpe用户添加 到oinstall组

usermod -G oinstall nrpe

4、执行check_oracle这个脚本就报错,如找不到服务名,没有权限等等。可能原因:

a、由于我们是在nrpe这个用户下执行check_oracle,所以一定要注意环境变量问题,把$ORACLE_HOME加到这个脚本中去。

标签:

给我留言