QA@IT
«回答へ戻る

回答を投稿

どのぐらいの精度でメールが欲しいのでしょうか。というか、外からの観察結果とシステム内からの観察結果の、システム内からの観察結果を欲していますが。

そもそもは、外からサーバがちゃんと動いているか?という外形監視と、内部が正常に動いているかと切り分けが必要ない感じなのでしょうか? ネットワークの不調や、負荷が高すぎて、MTAがまともに動かない or OOM killerで関連するプロセスがぶっ殺されている など中のダメージがそれほどでない場合でしか、sarを使う方法だと動かない気がします。

で、また大変なのが、ドコドコとメールが飛んでくることです。(賢いメール抑制アルゴリズムのあるソフトを使わないと運用担当者は堪ったモノではありません)

こんな時は、外形監視と内形監視の両方から責めるのが常道ですが、そこまで記述されていませんでしたので、ubuntuにインストールするタイプから、既存のサービスを使う方法など、いくつか利点と欠点があります。

運用系の設計をしている担当者と、いちどお話しになってみては? ノードの数や監視項目の数でも変わります。

たたき台としては、 nagios (+NRPE agent) + munin ぐらいと比較対象してみては?

どのぐらいの精度でメールが欲しいのでしょうか。というか、外からの観察結果とシステム内からの観察結果の、システム内からの観察結果を欲していますが。

そもそもは、外からサーバがちゃんと動いているか?という外形監視と、内部が正常に動いているかと切り分けが必要ない感じなのでしょうか? ネットワークの不調や、負荷が高すぎて、MTAがまともに動かない or OOM killerで関連するプロセスがぶっ殺されている など中のダメージがそれほどでない場合でしか、sarを使う方法だと動かない気がします。

で、また大変なのが、ドコドコとメールが飛んでくることです。(賢いメール抑制アルゴリズムのあるソフトを使わないと運用担当者は堪ったモノではありません)

こんな時は、外形監視と内形監視の両方から責めるのが常道ですが、そこまで記述されていませんでしたので、ubuntuにインストールするタイプから、既存のサービスを使う方法など、いくつか利点と欠点があります。

運用系の設計をしている担当者と、いちどお話しになってみては? ノードの数や監視項目の数でも変わります。

たたき台としては、 nagios (+NRPE agent) + munin ぐらいと比較対象してみては?