
Mi cuadro centos ha comenzado a comportarse de manera extraña, el registro ssh muestra:
pam_unix(sshd:session): session opened for user trading by (uid=0)
fatal: setresuid 502: Resource temporarily unavailable
Y en mi registro cron (para el mismo usuario) obtengo fallas
(CRON) ERROR (setreuid failed): Resource temporarily unavailable
Haciendo ulimit -a como ese usuario:
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 773824
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 2048
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 10240
cpu time (seconds, -t) unlimited
max user processes (-u) 1024
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
y limites.d 90-nproc.conf tiene:
* soft nproc 1024
root soft nproc unlimited
Pero ese usuario nunca parece obtener más de ~20 procesos cuando uso ps -eo user=|sort|uniq -c
, sin embargo, no he verificado la cantidad de procesos en el momento exacto en que obtenemos la falla.
Tenemos una pequeña cantidad de servicios Java en ese cuadro, que ejecuta el mismo usuario. ¿Pero parece que se está quedando sin procesos? También tenemos postgres, pero se ejecuta como un usuario diferente.
Algun consejo ? ¿Se está quedando sin procesos debido al límite de 1024 (¿debe estar lleno en el momento de las fallas?), o estoy alcanzando un límite de recursos diferente.
Además, cuando veo /proc/{myprocid}/limits
:
Limit Soft Limit Hard Limit Units
Max cpu time unlimited unlimited seconds
Max file size unlimited unlimited bytes
Max data size unlimited unlimited bytes
Max stack size 10485760 unlimited bytes
Max core file size 0 unlimited bytes
Max resident set unlimited unlimited bytes
Max processes 1024 773824 processes
Max open files 100000 100000 files
Max locked memory 65536 65536 bytes
Max address space unlimited unlimited bytes
Max file locks unlimited unlimited locks
Max pending signals 773824 773824 signals
Max msgqueue size 819200 819200 bytes
Max nice priority 0 0
Max realtime priority 0 0
Max realtime timeout unlimited unlimited us
¿Por qué un proceso tiene un número máximo de procesos?
Respuesta1
Parece que la configuración en 90-nproc.conf es para evitar bombas de bifurcación; al menos eso es lo que dicen los comentarios en mi copia de ese archivo.
Eche un vistazo a /etc/ssh/sshd_config, específicamente al valor de "MaxStartUps". Intente aumentarlo a 1000. Si eso no hace ninguna diferencia, ¿por qué no aumentar el valor de los procesos de usuario máximos en /etc/security/limits.conf? En los servidores que administro están configurados en 65535.