shig**のブログ

shignoとshigenが日々をblogするところです。

広告

※このエリアは、60日間投稿が無い場合に表示されます。記事を投稿すると、表示されなくなります。

zabbix-agentのactive checkが動作しない。

2010-12-08 20:38:40 | xianでサーバー
active checkとは、いわゆるトラップ監視(?)のこと。
うちでは、ログ監視に使ってる。
zabbixでは、ログ監視はserver側から行うのではなく、agentが対象ログを随時監視していて、
ログが書き込まれるとトラップとしてserverに通知する仕組みになってるみたい。


で、前置きが長くなったけど、この間の再起動からログ監視に失敗する状況が続いてたことが、最近判明。
遅すぎw って感じですが、調査をしてみることに。


# more /var/log/zabbix-server/zabbix_server.log
2743:20101208:064019 Executing housekeeper
2743:20101208:064026 Deleted 12877 records from history and trends
2743:20101208:074126 Executing housekeeper
2743:20101208:074134 Deleted 12855 records from history and trends
2743:20101208:084234 Executing housekeeper
2743:20101208:084242 Deleted 12928 records from history and trends
2743:20101208:094342 Executing housekeeper
2743:20101208:094349 Deleted 12886 records from history and trends
2743:20101208:104449 Executing housekeeper
2743:20101208:104457 Deleted 12879 records from history and trends
2743:20101208:114557 Executing housekeeper


直近のzabbix-serverに不審なログは無し。housekeeperが動いて、古いログを定期的に破棄してるだけ。


# more zabbix-agent/zabbix_agentd.log
1773:20101208:201315 Timeout while answering request
1773:20101208:201318 Timeout while answering request
1773:20101208:201321 Timeout while answering request
1773:20101208:201324 Timeout while answering request
1773:20101208:201327 Timeout while answering request
1773:20101208:201330 Timeout while answering request
1773:20101208:201333 Timeout while answering request


同じくzabbix-agentにも不審なログは無し。
Timeout while answering requestは、agentでサポートされていない監視項目を呼び出すと書かれるらしい。今回の件とは別。
ならばと言うことで、再起動した当時のログを見てみると・・


# zmore zabbix-agent/zabbix_agentd.log.1.gz
------ zabbix-agent/zabbix_agentd.log.1.gz ------
2625:20101116:092739 One child process died. Exiting ...
2625:20101116:092741 ZABBIX Agent stopped
3582:20101116:100037 zabbix_agentd started. ZABBIX 1.4.6.
3586:20101116:100037 zabbix_agentd collector started
3587:20101116:100037 zabbix_agentd listener started
3588:20101116:100037 zabbix_agentd listener started
3589:20101116:100037 zabbix_agentd listener started
3590:20101116:100037 zabbix_agentd active check started [127.0.0.1:10051]
3590:20101116:100037 Getting list of active checks failed. Will retry after 60 seconds
3590:20101116:100701 Timeout while answering request
3590:20101116:100704 Timeout while answering request
3590:20101116:100707 Timeout while answering request


いました。再起動時にactive checkに失敗、以降は無効化されてたって事?
何で失敗したんだろう・・と色々調べてると、こんなサイトに。


dorakenのFreeBSDサーバ管理日記 - ZABBIXでサーバ管理・監視(Agent編)
===============================
ServerのIPを編集します。
#Server=127.0.0.1
Server=xx.xx.xx.xx

(注意事項:この時zabbixサーバーのzabbix_server.confに記述したIPと同じIPを記述しないとうまくデータ取得ができません。。)
===============================


ん?zabbix_server.confにIP指定するところなんて有ったっけ??
もう少し調べてみる・・


AvailabilityがUnknown - ZABBIX-JP フォーラム
===============================
【zabbix_agentd.conf】
Server=ザビックスサーバーのIP ※
ServerPort=10051 (ザビックスサーバーのport) ※
Hostname=エージェントの名前 ※
ListenPort=10050 (ザビックスエージェントのport)※
ListenIP=エージェントのIP ※
StartAgents=5
DebugLevel=3
PidFile=C:\Program Files\zabbix\zabbix_agentd.pid
LogFile=C:\Program Files\zabbix\zabbix_agent.log
Timeout=3

【/etc/zabbix/zabbix_server.conf】
ListenPort=10051 (ザビックスサーバーのport) ※
ListenIP=ザビックスサーバーのIP ※
SenderFrequency=30
DebugLevel=3
Timeout=5
PidFile=/var/run/zabbix/zabbix_server.pid
LogFile=/var/log/zabbix/zabbix_server.log
AlertScriptsPath=/home/zabbix/bin/
DBHost=localhost
DBName=zabbix
DBUser=zabbix
DBPassword=xxxxxxxx


上記の「※」部分がzabbix server⇔agentd間の接続の情報です。
御確認下さい。
===============================


なるほどなるほど。
ではxianに実際に設定されている内容というと・・


# more /etc/zabbix/zabbix_server.conf
# Listen interface for trapper. Trapper will listen all network interfaces
# if this parameter is missing.

#ListenIP=127.0.0.1

# more /etc/zabbix/zabbix_agentd.conf
# This is config file for zabbix_agentd
# To get more information about ZABBIX, go http://www.zabbix.com

############ GENERAL PARAMETERS #################

# List of comma delimited IP addresses (or hostnames) of ZABBIX servers.
# No spaces allowed. First entry is used for sending active checks.
# Note that hostnames must resolve hostname->IP address and
# IP address->hostname.

Server=127.0.0.1



server側のListenIPがコメントアウトされてる。
試しにコメントアウトを外して(=有効にして。ややこしい・・)再起動してみる。


# zmore zabbix-agent/zabbix_agentd.log
------> zabbix-agent/zabbix_agentd.log <------
2661:20101208:201149 One child process died. Exiting ...
2661:20101208:201151 ZABBIX Agent stopped
1768:20101208:201154 zabbix_agentd started. ZABBIX 1.4.6.
1769:20101208:201154 zabbix_agentd collector started
1773:20101208:201154 zabbix_agentd active check started [127.0.0.1:10051]
1770:20101208:201154 zabbix_agentd listener started
1772:20101208:201154 zabbix_agentd listener started
1771:20101208:201154 zabbix_agentd listener started
1773:20101208:201303 Timeout while answering request
1773:20101208:201306 Timeout while answering request
1773:20101208:201309 Timeout while answering request


おー、active check成功したーー
どうやら原因はコレだった模様。ただし、設定ファイルは変更してないのに、なぜ再起動後に失敗するようになったかは不明。。
再起動に併せてアップデートも適用されてるはずだからその関係??


と言うわけで、zabbixのインストール時にはzabbix_server.confのListenIPを外すと良いみたいです。
自分が見た限り、インストール時にzabbix_agentd.confのServerの変更には触れていても、
zabbix_server.confに言及しているサイトは見当たらなかったので、チョッとしたおまじないです。
コメント   この記事についてブログを書く
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 液晶テレビ欲しい!! | トップ | SALUTE TRAINER~敬礼訓練プ... »
最新の画像もっと見る

コメントを投稿

xianでサーバー」カテゴリの最新記事