La caché de páginas de Linux ralentiza la E/S en un servidor de doble CPU con 64 GB de RAM

Question

El comportamiento que está viendo se debe a la forma en que Linux asigna memoria en un sistema NUMA.

Supongo (sin saberlo) que el sistema de 32 GB no es numa, o no es lo suficientemente numa como para que a Linux le importe.

El comportamiento de cómo tratar con numa lo dicta la /proc/sys/vm/zone_reclaim_modeopción. De forma predeterminada, Linux detectará si está utilizando un sistema numa y cambiará los indicadores de recuperación si cree que brindaría un mejor rendimiento.

La memoria se divide en zonas, en el sistema numa hay una zona para el primer zócalo de la CPU y una zona para el segundo. Estos aparecen como node0y node1. Puedes verlos si tienes gato /proc/buddyinfo.

Cuando el modo de recuperación de zona se establece en 1, la asignación desde el primer socket de la CPU hará que se produzca la recuperación en la zona de memoria asociada con esa CPU, esto se debe a que es más eficiente en términos de rendimiento recuperar desde un nodo numa local. En este sentido, recuperar es descartar páginas, como borrar el caché o intercambiar cosas en ese nodo.

Establecer el valor en 0 provoca que no se produzcan reclamaciones si la zona se está llenando, sino que se asigna a zonas numa externas para la memoria. Esto tiene el costo de un breve bloqueo de la otra CPU para obtener acceso exclusivo a esa zona de memoria.

¡Pero luego comienza a cambiar instantáneamente! después de unos segundos: Memoria: 66004536k en total, 65733796k usados, 270740k libres, 34250384k buffers Intercambio: 10239992k en total, 1178820k usados, 9061172k libres, 91388k en caché

El comportamiento de intercambio y cuándo intercambiar está determinado por algunos factores, uno de los cuales es qué tan activas son las páginas que se han asignado a las aplicaciones. Si no son muy activos, se intercambiarán a favor del trabajo más ocupado que se produce en la caché. Supongo que las páginas de sus máquinas virtuales no se activan con mucha frecuencia.

Answer 1