Quão bem as gravações simultâneas são dimensionadas com io_uring?

Question

A maioria dos discos tem algum suporte de hardware para gravações paralelas? Ou talvez os SSDs funcionem, mas os discos giratórios não?

Quase todos os discos funcionam, independentemente de estarem girando ou em estado sólido (mesmo os discos giratórios têm caches, portanto, para pequenas quantidades de dados, eles podem parecer não muito lentos). Chaves USB ou cartões SD baratos alcançarão uma simultaneidade ruim, mas também haverá algum nível de paralelismo... Em termos de comandos paralelos máximos para um único dispositivo, o SATA pode ter até 32, o SCSI tende a variar de 10 a 100, O NVMe pode chegar a 1000 (acho que as especificações limitam você a um máximo de 65536, mas não conheço nenhum dispositivo que chegue tão alto ainda).

As gravações são canalizadas (pelo barramento?) para o disco para que o kernel não precise esperar por uma resposta de ida e volta para cada uma?

Sim, várias gravações (ou leituras) podem ser enviadas em paralelo. No entanto, se isso acontecerá depende de muitas coisas (por exemplo, o kernel pode agrupá-los para maior eficiência, a sincronização pode ser necessária para que a fila tenha que ser drenada, etc.)

O próprio kernel acaba enfileirando todas as syscalls solicitadas via io_uring?

Talvez. io_uringcompletará a E/S em linha se não bloquear, caso contrário, entrará na fila. DeIO eficiente com io_uring: "Mais importante ainda, para operações que não serão bloqueadas, os dados serão servidos em linha".

Existem outros gargalos que não considerei?

Sim. Também não está claro se você está realizando E/S suficiente por segundo para realmente ver o benefício de algo como io_uring... Além disso, sincronizações frequentes provavelmente limitarão o paralelismo dependendo da frequência e de como estão sendo feitas. Se você estiver executando E/S em buffer, o kernel está eliminando o paralelismo mesmo no síncrono, porque você está gravando na RAM, então o kernel se desestabiliza da RAM em paralelo, sempre que possível. (Observe que os itens anteriores não são uma lista exaustiva)

(Pergunta do título)

Quão bem as gravações simultâneas são dimensionadas com io_uring?

OK, muito bem, dependendo de qual kernel você está usando e como você está enviando a E/S. Veja as referências e links nesteresposta para "Não há realmente nenhuma E/S de bloco assíncrona no Linux?".

Referências

Uma introdução à camada de bloco- série de duas partes falando sobre a camada de bloco
Linux Block IO: Apresentando o acesso SSD multifila em sistemas multinúcleo- artigo descrevendo a arquitetura de alterações de múltiplas filas do Linux
OIntrodução à camada de E/S de bloco do LinuxApresentação de vídeo no YouTube

Answer 1

A maioria dos discos tem algum suporte de hardware para gravações paralelas? Ou talvez os SSDs funcionem, mas os discos giratórios não?

Quase todos os discos funcionam, independentemente de estarem girando ou em estado sólido (mesmo os discos giratórios têm caches, portanto, para pequenas quantidades de dados, eles podem parecer não muito lentos). Chaves USB ou cartões SD baratos alcançarão uma simultaneidade ruim, mas também haverá algum nível de paralelismo... Em termos de comandos paralelos máximos para um único dispositivo, o SATA pode ter até 32, o SCSI tende a variar de 10 a 100, O NVMe pode chegar a 1000 (acho que as especificações limitam você a um máximo de 65536, mas não conheço nenhum dispositivo que chegue tão alto ainda).

As gravações são canalizadas (pelo barramento?) para o disco para que o kernel não precise esperar por uma resposta de ida e volta para cada uma?

Sim, várias gravações (ou leituras) podem ser enviadas em paralelo. No entanto, se isso acontecerá depende de muitas coisas (por exemplo, o kernel pode agrupá-los para maior eficiência, a sincronização pode ser necessária para que a fila tenha que ser drenada, etc.)

O próprio kernel acaba enfileirando todas as syscalls solicitadas via io_uring?

Talvez. io_uringcompletará a E/S em linha se não bloquear, caso contrário, entrará na fila. DeIO eficiente com io_uring: "Mais importante ainda, para operações que não serão bloqueadas, os dados serão servidos em linha".

Existem outros gargalos que não considerei?

Sim. Também não está claro se você está realizando E/S suficiente por segundo para realmente ver o benefício de algo como io_uring... Além disso, sincronizações frequentes provavelmente limitarão o paralelismo dependendo da frequência e de como estão sendo feitas. Se você estiver executando E/S em buffer, o kernel está eliminando o paralelismo mesmo no síncrono, porque você está gravando na RAM, então o kernel se desestabiliza da RAM em paralelo, sempre que possível. (Observe que os itens anteriores não são uma lista exaustiva)

(Pergunta do título)

Quão bem as gravações simultâneas são dimensionadas com io_uring?

OK, muito bem, dependendo de qual kernel você está usando e como você está enviando a E/S. Veja as referências e links nesteresposta para "Não há realmente nenhuma E/S de bloco assíncrona no Linux?".

Referências

Uma introdução à camada de bloco- série de duas partes falando sobre a camada de bloco
Linux Block IO: Apresentando o acesso SSD multifila em sistemas multinúcleo- artigo descrevendo a arquitetura de alterações de múltiplas filas do Linux
OIntrodução à camada de E/S de bloco do LinuxApresentação de vídeo no YouTube

Quão bem as gravações simultâneas são dimensionadas com io_uring?

Responder1

Referências

informação relacionada