Gnu parallel не использует все ресурсы ЦП

Question 1

Хотя ответ Марка правильный и полностью поддерживается, вам, возможно, захочется попробовать новую функцию.

cat file | parallel --pipe ...

максимальная скорость составляет около 100 МБ/с.

Новая экспериментальная опция --pipepart обеспечивает скорость > 2 ГБ/с, но требует, чтобы in.txt был реальным (доступным для поиска) файлом:

parallel -a in.txt --block 100M --pipepart python parse.py

Answer

Хотя ответ Марка правильный и полностью поддерживается, вам, возможно, захочется попробовать новую функцию.

cat file | parallel --pipe ...

максимальная скорость составляет около 100 МБ/с.

Новая экспериментальная опция --pipepart обеспечивает скорость > 2 ГБ/с, но требует, чтобы in.txt был реальным (доступным для поиска) файлом:

parallel -a in.txt --block 100M --pipepart python parse.py

Question 2

Это -N1приводит к созданию одного процесса на строку. Вы видите накладные расходы параллельной настройки. Вам следует изменить скрипт python для обработки более одной строки. Затем cat in.txt | parallel --pipe python parse.pyследует полностью использовать процессоры.

Answer

Это -N1приводит к созданию одного процесса на строку. Вы видите накладные расходы параллельной настройки. Вам следует изменить скрипт python для обработки более одной строки. Затем cat in.txt | parallel --pipe python parse.pyследует полностью использовать процессоры.

Gnu parallel не использует все ресурсы ЦП

решение1

решение2

Связанный контент