GNU Parallel Multithreading Pipe verbraucht wenig CPU-%, blockiert aber den Server

Question

Wie Luciano im Kommentar sagt, ist die Ursache höchstwahrscheinlich der Festplatten-E/A.

Der Grund für die zusätzlichen Prozesse ist, dass Ihre Pipeline mindestens 5 Prozesse startet. Sie sollten also mindestens 64*5 gestartete Prozesse sehen. Einige davon können auch mehrere Threads starten.

Parallele Festplatten-E/A sind sehr unvorhersehbar (siehehttps://oletange.wordpress.com/2015/07/04/parallel-disk-io-is-it-faster/), und es ist in der Praxis unmöglich zu sagen, wie viele parallele Jobs optimal sind, weil dies von so vielen Faktoren abhängt.

Um Ihren Flow zu optimieren, würde ich die Anzahl der Jobs anpassen, bis Sie den höchsten Durchsatz erzielen. Sie können --joblog verwenden, um zu sehen, wie lange jeder Job läuft.

Answer 1

Wie Luciano im Kommentar sagt, ist die Ursache höchstwahrscheinlich der Festplatten-E/A.

Der Grund für die zusätzlichen Prozesse ist, dass Ihre Pipeline mindestens 5 Prozesse startet. Sie sollten also mindestens 64*5 gestartete Prozesse sehen. Einige davon können auch mehrere Threads starten.

Parallele Festplatten-E/A sind sehr unvorhersehbar (siehehttps://oletange.wordpress.com/2015/07/04/parallel-disk-io-is-it-faster/), und es ist in der Praxis unmöglich zu sagen, wie viele parallele Jobs optimal sind, weil dies von so vielen Faktoren abhängt.

Um Ihren Flow zu optimieren, würde ich die Anzahl der Jobs anpassen, bis Sie den höchsten Durchsatz erzielen. Sie können --joblog verwenden, um zu sehen, wie lange jeder Job läuft.

GNU Parallel Multithreading Pipe verbraucht wenig CPU-%, blockiert aber den Server

Antwort1

verwandte Informationen