Könnte AIO fsync die Dpkg-Leistung verbessern?

Question

Die Frage deutet darauf hin, dass dies bei ext4 oder XFS nicht hilft.

Ich habe es auch mit der Installation eines viel größeren Pakets ( linux-image-4.9.0-9-amd64) getestet. Es schien immer noch gleich lange zu dauern, unabhängig von --force-unsafe-io.

ext2

Unter ext2 --force-unsafe-iowurde die Installationszeit linux-imagevon 50 Sekunden auf 13 Sekunden reduziert.

Der Kernel, auf dem ich die Tests ausgeführt habe, war 5.0.17-200.fc29.x86_64, der verwendet CONFIG_EXT4_USE_FOR_EXT2.

Ich habe ext2 mit der Userspace-Implementierung aio_fsync() getestet. Die beste Verbesserung war jedoch nicht von der Verwendung von AIO fsync() abhängig.

Meine Verbesserung war eigentlich auf einen Nebeneffekt zurückzuführen. Ich hatte dpkg so geändert, dass es zuerst alle fsync()-Operationen und dann alle rename()-Operationen ausführte. Während das ungepatchte dpkg nach jeder fsync()-Operation rename() aufrief. Ich verwendete AIO-Warteschlangentiefen von bis zu 256. AIO fsync() mit einer Warteschlangentiefe von 1 war deutlich langsamer als synchrones fsync() – es scheint, als ob es einen gewissen Overhead gab. Die beste Verbesserung erforderte auch, SYNC_FILE_RANGE_WRITEzuerst alle ursprünglichen Operationen auszuführen. Die verbesserte Version ließ sich linux-imagein etwa 18 Sekunden installieren.

Diese Reihenfolge der Operationen ist eigentlich das, was Ted T'so ursprünglich vorgeschlagen hat :-D. Was passiert, ist CONFIG_EXT4_USE_FOR_EXT2, dass fsync() auch hilfreicherweise das übergeordnete Verzeichnis synchronisiert. Sie möchten zuerst alle Dateinamenmanipulationen durchführen, damit Sie mehrere Aktualisierungen auf der Festplatte für jedes Verzeichnis vermeiden können. CONFIG_EXT2Ich glaube nicht, dass dies bei der alten Implementierung oder bei einem normalen ext4Dateisystem passiert .

ext4: Lassen Sie fsync dieses Mal das übergeordnete Verzeichnis wirklich im No-Journal synchronisieren

[...] Dies schließt natürlich auch den Ext2-Standardmodus ein. [...]

https://elixir.bootlin.com/linux/v5.0.17/source/fs/ext4/fsync.c#L38

 * If we're not journaling and this is a just-created file, we have to
 * sync our parent directory (if it was freshly created) since
 * otherwise it will only be written by writeback, leaving a huge
 * window during which a crash may lose the file.  This may apply for
 * the parent directory's parent as well, and so on recursively, if
 * they are also freshly created.

Wie zuvor scheint das Ersetzen der fsync()-Phase durch sync() eine beunruhigend gute Leistung zu erbringen, passend --force-unsafe-io:-). sync() oder syncfs() scheinen sehr gut zu sein, wenn man damit durchkommt.

btrfs

Als ich begann, aio_fsync() auf btrfs zu testen, entdeckte ich, dass fsync()-Operationen aufgrund eines kürzlich erfolgten Datenintegritätsfixes dazu führen können, dass rename() der Datei blockiert wird. Ich entschied, dass ich an btrfs nicht interessiert bin.

Warum dauert rename() länger, wenn zuerst fsync() aufgerufen wird?

Answer 1

Die Frage deutet darauf hin, dass dies bei ext4 oder XFS nicht hilft.

Ich habe es auch mit der Installation eines viel größeren Pakets ( linux-image-4.9.0-9-amd64) getestet. Es schien immer noch gleich lange zu dauern, unabhängig von --force-unsafe-io.

ext2

Unter ext2 --force-unsafe-iowurde die Installationszeit linux-imagevon 50 Sekunden auf 13 Sekunden reduziert.

Der Kernel, auf dem ich die Tests ausgeführt habe, war 5.0.17-200.fc29.x86_64, der verwendet CONFIG_EXT4_USE_FOR_EXT2.

Ich habe ext2 mit der Userspace-Implementierung aio_fsync() getestet. Die beste Verbesserung war jedoch nicht von der Verwendung von AIO fsync() abhängig.

Meine Verbesserung war eigentlich auf einen Nebeneffekt zurückzuführen. Ich hatte dpkg so geändert, dass es zuerst alle fsync()-Operationen und dann alle rename()-Operationen ausführte. Während das ungepatchte dpkg nach jeder fsync()-Operation rename() aufrief. Ich verwendete AIO-Warteschlangentiefen von bis zu 256. AIO fsync() mit einer Warteschlangentiefe von 1 war deutlich langsamer als synchrones fsync() – es scheint, als ob es einen gewissen Overhead gab. Die beste Verbesserung erforderte auch, SYNC_FILE_RANGE_WRITEzuerst alle ursprünglichen Operationen auszuführen. Die verbesserte Version ließ sich linux-imagein etwa 18 Sekunden installieren.

Diese Reihenfolge der Operationen ist eigentlich das, was Ted T'so ursprünglich vorgeschlagen hat :-D. Was passiert, ist CONFIG_EXT4_USE_FOR_EXT2, dass fsync() auch hilfreicherweise das übergeordnete Verzeichnis synchronisiert. Sie möchten zuerst alle Dateinamenmanipulationen durchführen, damit Sie mehrere Aktualisierungen auf der Festplatte für jedes Verzeichnis vermeiden können. CONFIG_EXT2Ich glaube nicht, dass dies bei der alten Implementierung oder bei einem normalen ext4Dateisystem passiert .

ext4: Lassen Sie fsync dieses Mal das übergeordnete Verzeichnis wirklich im No-Journal synchronisieren

[...] Dies schließt natürlich auch den Ext2-Standardmodus ein. [...]

https://elixir.bootlin.com/linux/v5.0.17/source/fs/ext4/fsync.c#L38

 * If we're not journaling and this is a just-created file, we have to
 * sync our parent directory (if it was freshly created) since
 * otherwise it will only be written by writeback, leaving a huge
 * window during which a crash may lose the file.  This may apply for
 * the parent directory's parent as well, and so on recursively, if
 * they are also freshly created.

Wie zuvor scheint das Ersetzen der fsync()-Phase durch sync() eine beunruhigend gute Leistung zu erbringen, passend --force-unsafe-io:-). sync() oder syncfs() scheinen sehr gut zu sein, wenn man damit durchkommt.

btrfs

Als ich begann, aio_fsync() auf btrfs zu testen, entdeckte ich, dass fsync()-Operationen aufgrund eines kürzlich erfolgten Datenintegritätsfixes dazu führen können, dass rename() der Datei blockiert wird. Ich entschied, dass ich an btrfs nicht interessiert bin.

Warum dauert rename() länger, wenn zuerst fsync() aufgerufen wird?

Könnte AIO fsync die Dpkg-Leistung verbessern?

Antwort1

ext2

btrfs

verwandte Informationen