O cache de páginas do Linux retarda o IO no servidor de CPU dupla com 64 GB de RAM

Question

O comportamento que você está vendo se deve à maneira como o Linux aloca memória em um sistema NUMA.

Estou assumindo (sem saber) que o sistema de 32GB não é numa, ou não é numa o suficiente para o Linux se importar.

O comportamento de como lidar com os numa é ditado pela /proc/sys/vm/zone_reclaim_modeopção. Por padrão, o Linux detectará se você está usando um sistema numa e alterará os sinalizadores de recuperação se achar que proporcionaria melhor desempenho.

A memória é dividida em zonas, num sistema existe uma zona para o primeiro soquete da CPU e uma zona para o segundo. Eles aparecem como node0e node1. Você pode vê-los se você for um gato /proc/buddyinfo.

Quando o modo de recuperação de zona é definido como 1, a alocação do primeiro soquete da CPU fará com que a recuperação ocorra na zona de memória associada a essa CPU, isso ocorre porque é mais eficiente em termos de desempenho recuperar de um nó numa local. Nesse sentido, recuperar é descartar páginas, como limpar o cache ou trocar coisas naquele nó.

Definir o valor como 0 faz com que nenhuma recuperação ocorra se a zona estiver sendo preenchida, em vez disso, alocando nas zonas numa estrangeiras para a memória. Isso tem o custo de um breve bloqueio da outra CPU para obter acesso exclusivo a essa zona de memória.

Mas então ele começa a trocar instantaneamente! após alguns segundos: Mem: 66004536k no total, 65733796k usados, 270740k livres, 34250384k buffers Troca: 10239992k no total, 1178820k usados, 9061172k livres, 91388k em cache

O comportamento de troca e quando trocar é determinado por alguns fatores, sendo um deles o quão ativas são as páginas que foram alocadas aos aplicativos. Se não estiverem muito ativos, serão trocados em favor do trabalho mais movimentado que ocorre no cache. Presumo que as páginas nas suas VMs não sejam ativadas com muita frequência.

Answer 1