OOM-Killer, jboss y pánico del kernel

Question 1

Personalmente, nunca usaría PAE (más de 4G de RAM en un sistema de 32 bits). Obtendrá un rendimiento mucho mayor ejecutando un kernel y un sistema reales de 64 bits.

OOM solo debería activarse cuando un malloc pueda fallar. (no cuando tienes muchos intercambios disponibles)

Es probable que el kernel de 32 bits sea parte de la causa. PAE utiliza diferentes zonas de memoria y es posible que a una zona no se le permita realizar malloc desde otra.

¿Has modificado tu swappiness? (Con qué facilidad el núcleo utilizará el intercambio). cat /proc/sys/vm/swappiness ?

También puedes investigar el ajuste de vm.dirty_ratio o vm.lower_zone_protection = 100.

¿Has captado el pánico del núcleo? (una consola serie suele ser una buena forma de hacer esto)

También puede intentar adelantarse al OOM-Killer con su propio software de monitoreo de procesos. (eche un vistazo a Monit)

Toda la suerte

Answer

Personalmente, nunca usaría PAE (más de 4G de RAM en un sistema de 32 bits). Obtendrá un rendimiento mucho mayor ejecutando un kernel y un sistema reales de 64 bits.

OOM solo debería activarse cuando un malloc pueda fallar. (no cuando tienes muchos intercambios disponibles)

Es probable que el kernel de 32 bits sea parte de la causa. PAE utiliza diferentes zonas de memoria y es posible que a una zona no se le permita realizar malloc desde otra.

¿Has modificado tu swappiness? (Con qué facilidad el núcleo utilizará el intercambio). cat /proc/sys/vm/swappiness ?

También puedes investigar el ajuste de vm.dirty_ratio o vm.lower_zone_protection = 100.

¿Has captado el pánico del núcleo? (una consola serie suele ser una buena forma de hacer esto)

También puede intentar adelantarse al OOM-Killer con su propio software de monitoreo de procesos. (eche un vistazo a Monit)

Toda la suerte

Question 2

Dehttp://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1002704

Las máquinas virtuales RHEL4 que ejecutan Oracle/Java eliminan procesos aleatoriamente mediante OOM Killer. Detalles OOM Killer elimina aplicaciones aunque ESX no esté bajo carga de memoria. El comando superior muestra que se está almacenando una gran cantidad de memoria en caché y apenas se utiliza el intercambio. Solución

Cuando el tamaño de los datos a copiar excede el tamaño de la memoria física, oom-killer comienza a eliminar procesos aleatoriamente.

Esto se puede solucionar ejecutando:

sysctl -w vm.protección_zona_inferior 100

Cuando lower_zone_protection se establece en 100, aumenta el umbral de páginas libres en 100, iniciando así la recuperación de páginas antes y evitando que NFS (Network File System) se quede muy por detrás de las demandas de memoria del kernel. Esto hace que la recuperación de páginas se realice antes, proporcionando así más "protección" para las zonas. Redhat identifica este problema en RHEL y han proporcionado una solución alternativa en los siguientes artículos:

Answer