Linux-Seitencache verlangsamt die IO auf einem Dual-CPU-Server mit 64 GB RAM

Question

Das von Ihnen beobachtete Verhalten ist auf die Art und Weise zurückzuführen, wie Linux auf einem NUMA-System Speicher zuweist.

Ich gehe davon aus (ohne es zu wissen), dass das 32-GB-System kein NUMA ist oder nicht NUMA genug, als dass es Linux interessieren würde.

Das Verhalten im Umgang mit Numa wird durch die /proc/sys/vm/zone_reclaim_modeOption bestimmt. Standardmäßig erkennt Linux, ob Sie ein Numa-System verwenden, und ändert die Reclaim-Flags, wenn es der Meinung ist, dass dies zu einer besseren Leistung führt.

Der Speicher ist in Zonen aufgeteilt. Im Numa-System gibt es eine Zone für den ersten CPU-Sockel und eine Zone für den zweiten. Diese werden als node0und angezeigt node1. Sie können sie sehen, wenn Sie cat verwenden /proc/buddyinfo.

Wenn der Zonenrückgewinnungsmodus auf 1 eingestellt ist, führt die Zuweisung vom ersten CPU-Sockel dazu, dass die Rückgewinnung in der Speicherzone erfolgt, die dieser CPU zugeordnet ist. Dies liegt daran, dass die Rückgewinnung von einem lokalen NUMA-Knoten aus leistungstechnischer Sicht effizienter ist. Rückgewinnung bedeutet in diesem Sinne das Löschen von Seiten, z. B. das Leeren des Caches oder das Auslagern von Inhalten auf diesem Knoten.

Wenn Sie den Wert auf 0 setzen, werden keine Rückforderungen vorgenommen, wenn die Zone voll ist. Stattdessen wird der Speicher den fremden Numa-Zonen zugewiesen. Dies geht auf Kosten einer kurzen Sperrung der anderen CPU, um exklusiven Zugriff auf diese Speicherzone zu erhalten.

Aber dann beginnt es sofort mit dem Swapping! Nach ein paar Sekunden: Mem: 66004536k gesamt, 65733796k genutzt, 270740k frei, 34250384k Puffer Swap: 10239992k gesamt, 1178820k genutzt, 9061172k frei, 91388k zwischengespeichert

Das Auslagerungsverhalten und der Zeitpunkt der Auslagerung werden von mehreren Faktoren bestimmt. Einer davon ist, wie aktiv die Seiten sind, die den Anwendungen zugewiesen wurden. Wenn sie nicht sehr aktiv sind, werden sie zugunsten der arbeitsintensiveren Arbeit im Cache ausgelagert. Ich gehe davon aus, dass die Seiten in Ihren VMs nicht sehr oft aktiviert werden.

Answer 1