複数の Linux ホスト上の重要なログ ファイルを監視しますか?

複数の Linux ホスト上の重要なログ ファイルを監視しますか?

AWS 上でいくつかのサーバーが稼働しており、すべての重要なサービスの監視を Nagios/Icinga で行っています。

system, DB, PHP, Apache, etc私たちは、システム上のすべてのログを監視する最善の方法を模索しています。そうすればmax_clients、電子メールですぐに問題 (たとえば、Apache が昨日しきい値に達したなど) を知ることができます。現在、ログはサービスが停止した後にのみ確認しており、停止する前には確認していません。これは良くありません。

私は Linux 管理の初心者ですが、オンラインで検索した結果、次のオプションが見つかりました。

  1. Nagios スクリプトログを監視する- 問題は、それらのほとんどが一度に 1 つのログ ファイルで 1 つの特定の正規表現をチェックすることです。ログ ファイルごとに 1 つのサービスをインストールするのはスケーラブルではありません (監視する必要があるすべてのログ ファイルを把握しているわけではありません)。
  2. logrobot.comのようなサービス- ただし、これがどれほど効果があるかはわかりません。

最小限の構成で複数のサーバー上のすべてのログを監視するための最良の方法についてアドバイスをいただければ幸いです。

答え1

監視する必要があるサーバー/ログの数はわかりませんが、解決策はたくさんあります

小さな環境

rsyslogと好みのフロントエンド(例:LogAnalyzer)を使用します。翻訳元:

より大きな環境

私たちは、ログシッパーとして beaver、インデクサーとして logstash、バックエンドとして elasticsearch を使用して、(+300 システム) からサーバーログを監視しています。このソリューションは、[ここにランダムな数字を挿入] ホストまで拡張できます ;)

答え2

基本的に、同じホスト上のログを読み取るのではなく (少なくとも、同じホスト上のログだけを読み取るのではなく)、代わりに、サーバーのすべてのログを一元管理する何らかのログサーバーを使用する必要があります。

ログが入力された後に変更されないようにするために、この設定を使用しました。

さらに、logcheck を使用するだけで、ログが自動的にチェックされます。

基本的に、これは許容可能で無視できる行をチェックし、事前に logcheck に無視するように指示しなかった行のみを送信します。

すべてのサーバーに簡単にインストールできます。

グラフィカルバージョンでは、重大なログエントリの数などを数える

logzilla は良い選択肢ですが、もう無料ではないと思います。

答え3

私は数日間検索(「ログ管理ソリューション」)し、まさに探していたツールを見つけました。次の 3 つのツールはクラウド ベースのログ ツールで、セットアップと構成が簡単です。システム ログとカスタム ログをサーバーに送信して保存し、正規表現パターンの電子メール/Webhook アラートを検索してセットアップできます。

  1. ペーパートレイル- これまでで最もシンプルで高速なインターフェース (ターミナルの tail -f のような)。価格も非常に手頃です。ただし、カスタム ログ (apache、mysql、アプリケーション) を設定するには、ある程度の時間を費やす必要があります。Go ベースのログ シッパー (現在ベータ版) はメモリ効率が非常に高く、監視する必要があるログ ファイルを GIT リポジトリ経由でデプロイできます。
  2. ログエントリ- 非常にシンプルです。 'le' デーモンを使用してカスタム ログを設定するのが最も簡単です。 非常に多くの機能があり、papertrail と比較すると肥大化しているように見えます。 スタートアップにとって、無料プランは非常に充実しています。
  3. ログリー- 他の 2 つと同じ機能をすべて提供していますが、操作が非常に複雑です。また、無料プランではアラートは提供されません。

答え4

logrobot.com に関しては、まさに必要な機能を備えた無料バージョンが現在提供されており、ここからダウンロードできます。

http://www.logxray.com/logxray.zip

これを使用して懸念に対処するには、次のように logxray を実行します。

./logxray localhost:emailing /apps/logxray autonda /var/log/messages 60m 'kernel|error|panic|fail' 'timed out' 1 2 -show error_check [メールアドレス]

複数のログまたは特定のディレクトリ内の特定のログを監視するには:

./logxray ローカルホスト /apps/logxray autoblz ログ 60m 'パニック|エラー' '.' 1 1 directory_error_watch -ndfoundn

http://www.logXray.com(ツールの使用方法に関する詳細情報やドキュメント)

関連情報