
Minha caixa centos começou a se comportar de maneira estranha, o log do ssh mostra:
pam_unix(sshd:session): session opened for user trading by (uid=0)
fatal: setresuid 502: Resource temporarily unavailable
E no meu cron log (para o mesmo usuário) recebo falhas
(CRON) ERROR (setreuid failed): Resource temporarily unavailable
Fazendo ulimit -a como esse usuário:
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 773824
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 2048
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 10240
cpu time (seconds, -t) unlimited
max user processes (-u) 1024
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
e limites.d 90-nproc.conf tem:
* soft nproc 1024
root soft nproc unlimited
Mas esse usuário nunca parece obter mais de 20 processos quando eu uso ps -eo user=|sort|uniq -c
, porém não verifiquei o número de processos no momento exato em que ocorre a falha.
Temos um pequeno número de serviços Java nessa caixa, executados pelo mesmo usuário. Mas parece que os processos estão acabando? Também temos o postgres, mas ele é executado como um usuário diferente.
Alguma dica? Ele está ficando sem processos devido ao limite de 1.024 (deve estar estourando no momento das falhas?) Ou estou atingindo um limite de recursos diferente.
Além disso, quando vejo /proc/{myprocid}/limits
:
Limit Soft Limit Hard Limit Units
Max cpu time unlimited unlimited seconds
Max file size unlimited unlimited bytes
Max data size unlimited unlimited bytes
Max stack size 10485760 unlimited bytes
Max core file size 0 unlimited bytes
Max resident set unlimited unlimited bytes
Max processes 1024 773824 processes
Max open files 100000 100000 files
Max locked memory 65536 65536 bytes
Max address space unlimited unlimited bytes
Max file locks unlimited unlimited locks
Max pending signals 773824 773824 signals
Max msgqueue size 819200 819200 bytes
Max nice priority 0 0
Max realtime priority 0 0
Max realtime timeout unlimited unlimited us
Por que um processo tem um número máximo de processos?
Responder1
Parece que a configuração em 90-nproc.conf é para evitar bombas bifurcadas - pelo menos é o que dizem os comentários na minha cópia desse arquivo.
Dê uma olhada em /etc/ssh/sshd_config, especificamente no valor de "MaxStartUps". Tente aumentar para 1000. Se isso não faz diferença, por que não aumentar o valor do máximo de processos do usuário em /etc/security/limits.conf? Nos servidores que gerencio, eles estão configurados para 65535.