Может ли AIO fsync улучшить производительность dpkg?

Question

Вопрос предполагает, что это не поможет на ext4 или XFS.

Я также протестировал установку одного гораздо большего пакета ( linux-image-4.9.0-9-amd64). Казалось, что это все равно заняло то же время, независимо от --force-unsafe-io.

ехт2

На ext2 --force-unsafe-ioвремя установки сокращено linux-imageс 50 до 13 секунд.

Ядро, на котором я проводил тесты 5.0.17-200.fc29.x86_64, использовало CONFIG_EXT4_USE_FOR_EXT2.

Я протестировал ext2 с использованием реализации aio_fsync() в пользовательском пространстве. Однако наилучшее улучшение не зависело от использования AIO fsync().

Мое улучшение на самом деле было вызвано побочным эффектом. Я изменил dpkg так, чтобы он сначала выполнял все операции fsync(), а затем все операции rename(). В то время как непатченный dpkg вызывал rename() после каждой fsync(). Я использовал глубину очереди AIO до 256. AIO fsync() с глубиной очереди 1 был значительно медленнее синхронного fsync() — похоже, были некоторые накладные расходы. Лучшее улучшение также требовало SYNC_FILE_RANGE_WRITEсначала выполнения всех исходных операций. Улучшенная версия установилась linux-imageпримерно за 18 секунд.

Этот порядок операций на самом деле изначально предлагал Тед Т'со :-D. Происходит то, что на CONFIG_EXT4_USE_FOR_EXT2, fsync() также услужливо синхронизирует родительский каталог. Сначала вы хотите выполнить все манипуляции с именами файлов, чтобы избежать множественных обновлений на диске для каждого каталога. Я думаю, что этого не происходит в старой CONFIG_EXT2реализации или в обычной ext4файловой системе.

ext4: на этот раз сделайте fsync для реальной синхронизации родительского каталога в no-journal

[...] Это также, очевидно, включает режим ext2 по умолчанию. [...]

https://elixir.bootlin.com/linux/v5.0.17/source/fs/ext4/fsync.c#L38

 * If we're not journaling and this is a just-created file, we have to
 * sync our parent directory (if it was freshly created) since
 * otherwise it will only be written by writeback, leaving a huge
 * window during which a crash may lose the file.  This may apply for
 * the parent directory's parent as well, and so on recursively, if
 * they are also freshly created.

Как и прежде, замена этапа fsync() на sync(), похоже, обеспечивает пугающе хорошую производительность, соответствующая --force-unsafe-io:-). sync() или syncfs() кажутся очень хорошими, если вы можете обойтись без их использования.

btrfs

Когда я начал тестировать aio_fsync() на btrfs, я обнаружил, что операции fsync() могут привести к блокировке rename() файла из-за недавнего исправления целостности данных. Я решил, что btrfs мне неинтересен.

Почему rename() выполняется дольше, если fsync() вызывается первым?

Answer 1

Вопрос предполагает, что это не поможет на ext4 или XFS.

Я также протестировал установку одного гораздо большего пакета ( linux-image-4.9.0-9-amd64). Казалось, что это все равно заняло то же время, независимо от --force-unsafe-io.

ехт2

На ext2 --force-unsafe-ioвремя установки сокращено linux-imageс 50 до 13 секунд.

Ядро, на котором я проводил тесты 5.0.17-200.fc29.x86_64, использовало CONFIG_EXT4_USE_FOR_EXT2.

Я протестировал ext2 с использованием реализации aio_fsync() в пользовательском пространстве. Однако наилучшее улучшение не зависело от использования AIO fsync().

Мое улучшение на самом деле было вызвано побочным эффектом. Я изменил dpkg так, чтобы он сначала выполнял все операции fsync(), а затем все операции rename(). В то время как непатченный dpkg вызывал rename() после каждой fsync(). Я использовал глубину очереди AIO до 256. AIO fsync() с глубиной очереди 1 был значительно медленнее синхронного fsync() — похоже, были некоторые накладные расходы. Лучшее улучшение также требовало SYNC_FILE_RANGE_WRITEсначала выполнения всех исходных операций. Улучшенная версия установилась linux-imageпримерно за 18 секунд.

Этот порядок операций на самом деле изначально предлагал Тед Т'со :-D. Происходит то, что на CONFIG_EXT4_USE_FOR_EXT2, fsync() также услужливо синхронизирует родительский каталог. Сначала вы хотите выполнить все манипуляции с именами файлов, чтобы избежать множественных обновлений на диске для каждого каталога. Я думаю, что этого не происходит в старой CONFIG_EXT2реализации или в обычной ext4файловой системе.

ext4: на этот раз сделайте fsync для реальной синхронизации родительского каталога в no-journal

[...] Это также, очевидно, включает режим ext2 по умолчанию. [...]

https://elixir.bootlin.com/linux/v5.0.17/source/fs/ext4/fsync.c#L38

 * If we're not journaling and this is a just-created file, we have to
 * sync our parent directory (if it was freshly created) since
 * otherwise it will only be written by writeback, leaving a huge
 * window during which a crash may lose the file.  This may apply for
 * the parent directory's parent as well, and so on recursively, if
 * they are also freshly created.

Как и прежде, замена этапа fsync() на sync(), похоже, обеспечивает пугающе хорошую производительность, соответствующая --force-unsafe-io:-). sync() или syncfs() кажутся очень хорошими, если вы можете обойтись без их использования.

btrfs

Когда я начал тестировать aio_fsync() на btrfs, я обнаружил, что операции fsync() могут привести к блокировке rename() файла из-за недавнего исправления целостности данных. Я решил, что btrfs мне неинтересен.

Почему rename() выполняется дольше, если fsync() вызывается первым?

Может ли AIO fsync улучшить производительность dpkg?

решение1

ехт2

btrfs

Связанный контент