Warum sind 16 Threads effizienter als 8 auf einem i7 mit 4 Hyperthreading-Kernen? (Robocopy)

Question

TL;dr-Version: Wenn Sie etwas sehr CPU-intensives tun, wie z. B. das Transkodieren von Videos mit Handbrake, möchten Sie nicht mehr Kerne als CPUs verwenden, da die Arbeit sonst nirgendwo erledigt werden könnte. In diesem Fall, in dem die meisten Threads 90 % ihrer Zeit im Ruhezustand verbringen und auf Lese- oder Schreibvorgänge warten, funktioniert es, mehr Threads zu habenfürSie, anstatt dagegen.

Das Kopieren von Dateien ist keine besonders CPU-lastige Aufgabe. Zwar können mehr Kerne dabei helfen, zu verhindern, dass andere Aufgaben Ihr Kopiertool blockieren, aber es ist unwahrscheinlich, dass jeder Thread auch nur annähernd zu 100 % auf jedem Kern läuft.

Jeder Kopierthread sendet eine Leseanforderung an die Festplatte und wird dann in den Ruhezustand versetzt, während er darauf wartet, dass die Leseanforderung erfüllt wird. Ihre rotierende Rust-Festplatte hat im Allgemeinen eine Suchzeit von 9 Millisekunden, was in CPU-Begriffen praktisch eine Ewigkeit ist, und die Kopieraufgabe würde nicht einfach im Kreis laufen und fragen „Ist es schon fertig?“ und CPU-Zyklen verschwenden. Dies würde diesen Thread bei 100 % CPU-Auslastung sperren und Ressourcen verschwenden. Nein, was passiert, ist, dass der Thread einen Lesevorgang ausgibt und in den Ruhezustand versetzt wird, bis der Lesevorgang abgeschlossen ist und die Daten für den nächsten Schritt bereit sind.

In der Zwischenzeit macht ein anderer Thread dasselbe, wird beim Lesen blockiert und in den Ruhezustand versetzt. Dies geschieht bei allen 16 Ihrer Threads. (In Wirklichkeit werden Ihre Lese- und Schreibvorgänge zu zufälligen Zeiten erfolgen, da sie nicht mehr synchron sind, aber Sie verstehen, was ich meine.)

Sobald einer der Threads Daten bereithält, plant Windows diese neu und beginnt mit der Verarbeitung zum Schreiben. Für den Thread ist der Prozess derselbe. Er sagt „schreibe diese Daten in Datei x an Position y“ und Windows nimmt die Daten und plant den Thread neu ein. Windows führt die Hintergrundarbeit aus, um herauszufinden, wo sich die Datei befindet, verschiebt die Daten (möglicherweise über das Netzwerk, was die Verzögerung um weitere Millisekunden verlängert) und gibt die Kontrolle an den Thread zurück, sobald der Schreibvorgang erfolgreich war.

Kein Thread wird die ganze Zeit auf einem CPU-Kern laufen. Mehr Threads als CPUs sind daher kein Problem. Kein Thread wird lange genug aktiv sein, um ein Problem darzustellen.

Wenn Sie nur eine einzige CPU hätten und viele andere Threads gleichzeitig laufen hätten, könnte es zu einem Engpass bei der CPU kommen, aber bei einem Multicore-System mit dieser Art von Arbeitslast würde es mich überraschen, wenn die CPU das Problem wäre.

Es ist wahrscheinlicher, dass Sie einen Engpass bei der Festplattenleistung haben und die Warteschlangentiefe für die Lese- oder Schreibpuffer auf den Laufwerken erreichen. Durch die Verwendung von mehr Threads erhöhen Sieetwasan seine Grenzen, sei es auf der Festplatte oder im Netzwerk, und die einzige Möglichkeit, die optimale Thread-Anzahl herauszufinden, besteht darin, das zu tun, was Sie getan haben, und damit zu experimentieren.

Auf einem System mit SSD-zu-SSD-Kopieren würde ich vermuten, dass eine geringere Thread-Anzahl besser wäre, da die Latenz geringer wäre als beim Kopieren von Dateien von rotierenden Rust-Festplatten, beim Übertragen über das Netzwerk und beim Schreiben auf rotierende Rust-Festplatten. Ich habe jedoch keine Beweise, die diese Annahme stützen.

Answer 1