Gnu Parallel nutzt nicht die gesamte CPU

Question 1

Obwohl Marks Antwort richtig und voll unterstützt ist, möchten Sie vielleicht eine neue Funktion ausprobieren.

cat file | parallel --pipe ...

Das Maximum liegt bei etwa 100 MB/s.

Die neue experimentelle Option --pipepart liefert > 2 GB/s, erfordert aber, dass in.txt eine echte (suchbare) Datei ist:

parallel -a in.txt --block 100M --pipepart python parse.py

Answer

Obwohl Marks Antwort richtig und voll unterstützt ist, möchten Sie vielleicht eine neue Funktion ausprobieren.

cat file | parallel --pipe ...

Das Maximum liegt bei etwa 100 MB/s.

Die neue experimentelle Option --pipepart liefert > 2 GB/s, erfordert aber, dass in.txt eine echte (suchbare) Datei ist:

parallel -a in.txt --block 100M --pipepart python parse.py

Question 2

Dies -N1führt dazu, dass pro Zeile ein Prozess erstellt wird. Sie sehen den Overhead der parallelen Einrichtung. Sie sollten das Python-Skript ändern, um mehr als eine Zeile zu verarbeiten. Dann cat in.txt | parallel --pipe python parse.pysollten die CPUs voll ausgenutzt werden.

Answer

Dies -N1führt dazu, dass pro Zeile ein Prozess erstellt wird. Sie sehen den Overhead der parallelen Einrichtung. Sie sollten das Python-Skript ändern, um mehr als eine Zeile zu verarbeiten. Dann cat in.txt | parallel --pipe python parse.pysollten die CPUs voll ausgenutzt werden.

Gnu Parallel nutzt nicht die gesamte CPU

Antwort1

Antwort2

verwandte Informationen