Wie gut lassen sich gleichzeitige Schreibvorgänge mit io_uring skalieren?

Question

Verfügen die meisten Festplatten über eine gewisse Hardwareunterstützung für paralleles Schreiben? Oder ist das bei SSDs der Fall, bei rotierenden Festplatten jedoch nicht?

Dies gilt für nahezu alle Festplatten, unabhängig davon, ob es sich um rotierende oder Solid-State-Festplatten handelt (selbst rotierende Festplatten verfügen über Caches, sodass sie bei kleinen Datenmengen nicht zu langsam erscheinen). Billige USB-Sticks oder SD-Karten erreichen zwar eine schlechte Parallelität, aber auch hier ist ein gewisses Maß an Parallelität vorhanden ... Was die maximale Anzahl paralleler Befehle für ein einzelnes Gerät angeht, kann SATA bis zu 32 haben, SCSI tendiert zu 10 bis 100, NVMe kann bis in die 1000er-Bereiche gehen (ich glaube, die Spezifikation begrenzt Sie auf maximal 65536, aber ich kenne noch kein Gerät, das so hoch geht).

Werden Schreibvorgänge per Pipeline (über den Bus?) auf die Festplatte geleitet, sodass der Kernel nicht für jeden Schreibvorgang auf eine Roundtrip-Antwort warten muss?

Ja, mehrere Schreib- (oder Lese-)Vorgänge können parallel gesendet werden. Ob dies jedoch geschieht, hängt von vielen Faktoren ab (z. B. kann der Kernel sie aus Effizienzgründen zusammenfassen, eine Synchronisierung kann erforderlich sein, sodass die Warteschlange geleert werden muss usw.).

Stellt der Kernel am Ende alle über io_uring angeforderten Systemaufrufe selbst in die Warteschlange?

Vielleicht. io_uringwird die I/O inline abschließen, wenn es nicht blockiert, andernfalls wird es in die Warteschlange gestellt. VonEffiziente IO mit io_uring: „Noch wichtiger ist, dass bei Vorgängen, die nicht blockieren, die Daten inline bereitgestellt werden.“

Gibt es andere Engpässe, die ich nicht berücksichtigt habe?

Ja. Es ist auch unklar, ob Sie genug I/O pro Sekunde durchführen, um wirklich den Nutzen von etwas wie io_uring... zu sehen. Außerdem begrenzen häufige Synchronisierungen wahrscheinlich die Parallelität, je nach Häufigkeit und Art der Durchführung. Wenn Sie gepufferte I/O durchführen, holt der Kernel die Parallelität sogar im synchronen Modus heraus, weil Sie in den RAM schreiben, und der Kernel lädt den RAM dann, wenn möglich, parallel aus. (Beachten Sie, dass die vorherigen Punkte keine vollständige Liste darstellen.)

(Frage aus dem Titel)

Wie gut lassen sich gleichzeitige Schreibvorgänge mit io_uring skalieren?

OK bis sehr gut, je nachdem, welchen Kernel Sie verwenden und wie Sie die I/O übermitteln. Siehe die Referenzen und Links in diesemAntwort auf „Gibt es unter Linux wirklich keinen asynchronen Block-E/A?“.

Verweise

Eine Einführung in die Blockebene- zweiteilige Serie über die Blockschicht
Linux Block IO: Einführung des Multi-Queue-SSD-Zugriffs auf Multi-Core-Systemen- Dokument, das die Architektur von Linux-Multiqueue-Änderungen beschreibt
DerEinführung in die Linux Block I/O-SchichtYouTube-Videopräsentation

Answer 1

Verfügen die meisten Festplatten über eine gewisse Hardwareunterstützung für paralleles Schreiben? Oder ist das bei SSDs der Fall, bei rotierenden Festplatten jedoch nicht?

Dies gilt für nahezu alle Festplatten, unabhängig davon, ob es sich um rotierende oder Solid-State-Festplatten handelt (selbst rotierende Festplatten verfügen über Caches, sodass sie bei kleinen Datenmengen nicht zu langsam erscheinen). Billige USB-Sticks oder SD-Karten erreichen zwar eine schlechte Parallelität, aber auch hier ist ein gewisses Maß an Parallelität vorhanden ... Was die maximale Anzahl paralleler Befehle für ein einzelnes Gerät angeht, kann SATA bis zu 32 haben, SCSI tendiert zu 10 bis 100, NVMe kann bis in die 1000er-Bereiche gehen (ich glaube, die Spezifikation begrenzt Sie auf maximal 65536, aber ich kenne noch kein Gerät, das so hoch geht).

Werden Schreibvorgänge per Pipeline (über den Bus?) auf die Festplatte geleitet, sodass der Kernel nicht für jeden Schreibvorgang auf eine Roundtrip-Antwort warten muss?

Ja, mehrere Schreib- (oder Lese-)Vorgänge können parallel gesendet werden. Ob dies jedoch geschieht, hängt von vielen Faktoren ab (z. B. kann der Kernel sie aus Effizienzgründen zusammenfassen, eine Synchronisierung kann erforderlich sein, sodass die Warteschlange geleert werden muss usw.).

Stellt der Kernel am Ende alle über io_uring angeforderten Systemaufrufe selbst in die Warteschlange?

Vielleicht. io_uringwird die I/O inline abschließen, wenn es nicht blockiert, andernfalls wird es in die Warteschlange gestellt. VonEffiziente IO mit io_uring: „Noch wichtiger ist, dass bei Vorgängen, die nicht blockieren, die Daten inline bereitgestellt werden.“

Gibt es andere Engpässe, die ich nicht berücksichtigt habe?

Ja. Es ist auch unklar, ob Sie genug I/O pro Sekunde durchführen, um wirklich den Nutzen von etwas wie io_uring... zu sehen. Außerdem begrenzen häufige Synchronisierungen wahrscheinlich die Parallelität, je nach Häufigkeit und Art der Durchführung. Wenn Sie gepufferte I/O durchführen, holt der Kernel die Parallelität sogar im synchronen Modus heraus, weil Sie in den RAM schreiben, und der Kernel lädt den RAM dann, wenn möglich, parallel aus. (Beachten Sie, dass die vorherigen Punkte keine vollständige Liste darstellen.)

(Frage aus dem Titel)

Wie gut lassen sich gleichzeitige Schreibvorgänge mit io_uring skalieren?

OK bis sehr gut, je nachdem, welchen Kernel Sie verwenden und wie Sie die I/O übermitteln. Siehe die Referenzen und Links in diesemAntwort auf „Gibt es unter Linux wirklich keinen asynchronen Block-E/A?“.

Verweise

Eine Einführung in die Blockebene- zweiteilige Serie über die Blockschicht
Linux Block IO: Einführung des Multi-Queue-SSD-Zugriffs auf Multi-Core-Systemen- Dokument, das die Architektur von Linux-Multiqueue-Änderungen beschreibt
DerEinführung in die Linux Block I/O-SchichtYouTube-Videopräsentation

Wie gut lassen sich gleichzeitige Schreibvorgänge mit io_uring skalieren?

Antwort1

Verweise

verwandte Informationen