Насколько хорошо масштабируются параллельные записи с помощью io_uring?

Question

Есть ли у большинства дисков аппаратная поддержка параллельной записи? Или, может быть, у SSD она есть, а у вращающихся дисков — нет?

Почти все диски делают это, независимо от того, вращающиеся они или твердотельные (даже вращающиеся диски имеют кэши, поэтому для небольших объемов данных они могут показаться не слишком медленными). Дешевые USB-накопители или SD-карты будут достигать низкого уровня параллелизма, но некоторый уровень параллелизма там тоже будет... С точки зрения максимального количества параллельных команд для одного устройства, SATA может иметь до 32, SCSI, как правило, находится в диапазоне от 10 до 100, NVMe может достигать 1000 (я думаю, спецификация ограничивает вас максимумом в 65536, но я пока не знаю устройства, которое бы достигало такого высокого уровня).

Передаются ли записи на диск по конвейеру (по шине?), чтобы ядру не приходилось ждать ответа на каждый запрос?

Да, несколько записей (или чтений) могут быть отправлены параллельно. Однако произойдет ли это, зависит от многих факторов (например, ядро может группировать их вместе для эффективности, может потребоваться синхронизация, поэтому очередь должна быть очищена и т. д.)

Ставит ли ядро в очередь все системные вызовы, запрошенные через io_uring?

Может быть. io_uringзавершит ввод-вывод в строке, если он не заблокируется, в противном случае он будет поставлен в очередь. ИзЭффективный ввод-вывод с io_uring: «Что еще более важно, для операций, которые не будут блокироваться, данные передаются в режиме реального времени».

Есть ли еще какие-то узкие места, которые я не учел?

Да. Также неясно, достаточно ли вы делаете ввода-вывода в секунду, чтобы действительно увидеть выгоду от чего-то вроде io_uring... Кроме того, частые синхронизации, вероятно, ограничат параллелизм в зависимости от частоты и того, как они выполняются. Если вы делаете буферизованный ввод-вывод, ядро выжимает параллелизм даже в синхронном режиме, потому что вы пишете в ОЗУ, а затем ядро отключается от ОЗУ параллельно, где это возможно. (Обратите внимание, что предыдущие пункты не являются исчерпывающим списком)

(Вопрос из заголовка)

Насколько хорошо масштабируются параллельные записи с помощью io_uring?

OK или очень хорошо в зависимости от того, какое ядро вы используете и как вы отправляете ввод/вывод. Смотрите ссылки и ссылки в этомответ на вопрос «Действительно ли в Linux нет асинхронного блочного ввода-вывода?».

Рекомендации

Введение в блочный слой- серия из двух частей, рассказывающая о блочном слое
Linux Block IO: Представляем многоочередной доступ к SSD на многоядерных системах- статья, описывающая архитектуру многоочередных изменений Linux
TheВведение в уровень блочного ввода-вывода LinuxВидеопрезентация YouTube

Answer 1

Есть ли у большинства дисков аппаратная поддержка параллельной записи? Или, может быть, у SSD она есть, а у вращающихся дисков — нет?

Почти все диски делают это, независимо от того, вращающиеся они или твердотельные (даже вращающиеся диски имеют кэши, поэтому для небольших объемов данных они могут показаться не слишком медленными). Дешевые USB-накопители или SD-карты будут достигать низкого уровня параллелизма, но некоторый уровень параллелизма там тоже будет... С точки зрения максимального количества параллельных команд для одного устройства, SATA может иметь до 32, SCSI, как правило, находится в диапазоне от 10 до 100, NVMe может достигать 1000 (я думаю, спецификация ограничивает вас максимумом в 65536, но я пока не знаю устройства, которое бы достигало такого высокого уровня).

Передаются ли записи на диск по конвейеру (по шине?), чтобы ядру не приходилось ждать ответа на каждый запрос?

Да, несколько записей (или чтений) могут быть отправлены параллельно. Однако произойдет ли это, зависит от многих факторов (например, ядро может группировать их вместе для эффективности, может потребоваться синхронизация, поэтому очередь должна быть очищена и т. д.)

Ставит ли ядро в очередь все системные вызовы, запрошенные через io_uring?

Может быть. io_uringзавершит ввод-вывод в строке, если он не заблокируется, в противном случае он будет поставлен в очередь. ИзЭффективный ввод-вывод с io_uring: «Что еще более важно, для операций, которые не будут блокироваться, данные передаются в режиме реального времени».

Есть ли еще какие-то узкие места, которые я не учел?

Да. Также неясно, достаточно ли вы делаете ввода-вывода в секунду, чтобы действительно увидеть выгоду от чего-то вроде io_uring... Кроме того, частые синхронизации, вероятно, ограничат параллелизм в зависимости от частоты и того, как они выполняются. Если вы делаете буферизованный ввод-вывод, ядро выжимает параллелизм даже в синхронном режиме, потому что вы пишете в ОЗУ, а затем ядро отключается от ОЗУ параллельно, где это возможно. (Обратите внимание, что предыдущие пункты не являются исчерпывающим списком)

(Вопрос из заголовка)

Насколько хорошо масштабируются параллельные записи с помощью io_uring?

OK или очень хорошо в зависимости от того, какое ядро вы используете и как вы отправляете ввод/вывод. Смотрите ссылки и ссылки в этомответ на вопрос «Действительно ли в Linux нет асинхронного блочного ввода-вывода?».

Насколько хорошо масштабируются параллельные записи с помощью io_uring?

решение1

Рекомендации

Связанный контент