弊社のサーバーの 1 つで、PID が異常にリークしています。簡単なスケジュール スクリプトを作成したのですが、毎日、最高 PID が約 1% ずつ増加しているようです。300,000 個たとえば、8 月 24 日 00:00 の最高 PID が 50'796 の場合、8 月 25 日 00:00 の最高 PID は 345'899、8 月 26 日 00:00 の最高 PID は 655'241 などとなります。
サーバーを 1 週間以上オンのままにしておくと、10 日から 12 時の間にサーバーがハングし、RDP 経由でアクセスできなくなります。このような状況では、サーバーがリモート コマンドを一切受け付けないため、サーバーの電源を入れ直す必要があります。
そこで、サーバーのシャットダウンと再起動を規則正しく実行するための簡単なスクリプトを作成しました。毎週火曜日の午前 2 時にスクリプトが実行され、システムが再起動されます。これでシステム ロックアウトは発生しなくなりましたが、もちろん根本的な原因は解決されていません。
この問題のトラブルシューティングにはどのようなツールをお勧めしますか?
より詳しい情報:サーバーは当初問題なく稼働していた物理的にその後、P2V 操作を使用して地域のデータセンターに移行され、現在は VMware 上で実行されています。その中の「重量級」アプリケーションは、Microsoft SQL Server 2008 Enterprise です。
答え1
プロセスが常にサブプロセスを生成し、それが失敗する可能性があるようです。SysInternals (Microsoft) の ProcessMonitor (ここ) - このような問題を解決するとなると、本当に大変です。