
私の Centos ボックスの動作がおかしくなり始めており、SSH ログには次のように表示されます:
pam_unix(sshd:session): session opened for user trading by (uid=0)
fatal: setresuid 502: Resource temporarily unavailable
そして、私のcronログ(同じユーザー用)では失敗が記録されます
(CRON) ERROR (setreuid failed): Resource temporarily unavailable
そのユーザーとして ulimit -a を実行します:
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 773824
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 2048
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 10240
cpu time (seconds, -t) unlimited
max user processes (-u) 1024
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
limits.d 90-nproc.conf には次の内容が含まれています:
* soft nproc 1024
root soft nproc unlimited
しかし、私が を使用するとき、そのユーザーは 20 を超えるプロセスを取得することはないようですps -eo user=|sort|uniq -c
が、障害が発生した正確な時点のプロセス数は確認していません。
そのボックスには、同じユーザーによって実行される少数の Java サービスがあります。しかし、プロセスが不足しているようです。postgres もありますが、これは別のユーザーとして実行されています。
何かヒントはありますか? 1024 の制限によりプロセスが不足していますか (障害発生時にバーストしているのでしょうか)、それとも別のリソース制限に達していますか。
また、以下を表示すると/proc/{myprocid}/limits
:
Limit Soft Limit Hard Limit Units
Max cpu time unlimited unlimited seconds
Max file size unlimited unlimited bytes
Max data size unlimited unlimited bytes
Max stack size 10485760 unlimited bytes
Max core file size 0 unlimited bytes
Max resident set unlimited unlimited bytes
Max processes 1024 773824 processes
Max open files 100000 100000 files
Max locked memory 65536 65536 bytes
Max address space unlimited unlimited bytes
Max file locks unlimited unlimited locks
Max pending signals 773824 773824 signals
Max msgqueue size 819200 819200 bytes
Max nice priority 0 0
Max realtime priority 0 0
Max realtime timeout unlimited unlimited us
プロセスに最大プロセス数があるのはなぜですか?
答え1
90-nproc.conf の設定はフォーク爆弾を防ぐためのものであるようです。少なくとも、そのファイルの私のコピーのコメントにはそう書かれています。
/etc/ssh/sshd_config の「MaxStartUps」の値を確認してください。これを 1000 に増やしてみてください。それでも変化がない場合は、/etc/security/limits.conf の max user processes の値を増やしてみてはいかがでしょうか。私が管理しているサーバーでは、この値は 65535 に設定されています。