Как запустить несколько параллельных заданий оболочки и контролировать их все одновременно?

Question 1

Есть идеи, как это сделать?

Нет.

pv имеет опции -c и -N, которые позволят вам делать то, что вы хотите

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

но я не вижу, как применить эту функцию к нескольким конвейерам

Однако, если вы посмотрите на страницу руководства pv, вы увидите следующее:

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

Таким образом, вы можете расширить это для запуска нескольких задач параллельно, пока это приемлемо для просмотра прогресса в кластере небольших окон. Я бы попробовал Xdialog.

В настоящее время мне нужно отдельное окно терминала для каждого экземпляра трубы.

Моя главная мысль заключается в том, что вам не обязательно интерактивно открывать множество окон терминала, вы можете сделать так, чтобы один скрипт сам открывал множество диалоговых окон.

Answer

Есть идеи, как это сделать?

Нет.

pv имеет опции -c и -N, которые позволят вам делать то, что вы хотите

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

но я не вижу, как применить эту функцию к нескольким конвейерам

Однако, если вы посмотрите на страницу руководства pv, вы увидите следующее:

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

Таким образом, вы можете расширить это для запуска нескольких задач параллельно, пока это приемлемо для просмотра прогресса в кластере небольших окон. Я бы попробовал Xdialog.

В настоящее время мне нужно отдельное окно терминала для каждого экземпляра трубы.

Моя главная мысль заключается в том, что вам не обязательно интерактивно открывать множество окон терминала, вы можете сделать так, чтобы один скрипт сам открывал множество диалоговых окон.

Question 2

Вы искали --pipeGNU Parallel?

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

(кот включен для выразительности)

По умолчанию размер блока составляет 1 МБ, его можно изменить с помощью --block.

-- редактировать для личной переписки --

На основании вышеизложенного можно получить 1-1 переписку следующим образом:

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

(кот включен для выразительности)

Это не совсем оптимально, так как внутренний параллелизм не будет знать о своих братьях и сестрах и, таким образом, может порождать больше на server1, чем на server2. Один из способов избежать этого - -j1 на внешнем параллелизме, но это не будет оптимальным, если внутренний имеет достаточно блоков только для первого сервера. Другими словами: чтобы идеально сбалансировать вашу рабочую нагрузку, вам, возможно, придется немного повозиться с этим - возможно, даже использовать --load 100% или что-то подобное.

--- правка: Борьба со сбоями ---

Если process_pipeвозвращается ошибка, то следует повторить команду еще 2 раза:

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

Answer

Вы искали --pipeGNU Parallel?

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

(кот включен для выразительности)

По умолчанию размер блока составляет 1 МБ, его можно изменить с помощью --block.

-- редактировать для личной переписки --

На основании вышеизложенного можно получить 1-1 переписку следующим образом:

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

(кот включен для выразительности)

Это не совсем оптимально, так как внутренний параллелизм не будет знать о своих братьях и сестрах и, таким образом, может порождать больше на server1, чем на server2. Один из способов избежать этого - -j1 на внешнем параллелизме, но это не будет оптимальным, если внутренний имеет достаточно блоков только для первого сервера. Другими словами: чтобы идеально сбалансировать вашу рабочую нагрузку, вам, возможно, придется немного повозиться с этим - возможно, даже использовать --load 100% или что-то подобное.

--- правка: Борьба со сбоями ---

Если process_pipeвозвращается ошибка, то следует повторить команду еще 2 раза:

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

Как запустить несколько параллельных заданий оболочки и контролировать их все одновременно?

решение1

решение2

Связанный контент