Como posso executar vários trabalhos de shell paralelos e monitorar todos eles de uma vez?

Question 1

Algumas ideias em como fazer isso?

Não.

pv tem opções -c e -N que devem permitir que você faça o que quiser

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

mas não consigo ver como aplicar esse recurso a vários pipelines

No entanto, se você olhar a página de manual do pv, verá isto

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

Portanto, você pode estender isso para executar uma série de tarefas em paralelo, desde que seja aceitável visualizar o progresso em um cluster de pequenas janelas. Eu tentaria o Xdialog.

Atualmente, preciso de uma janela de terminal separada para cada instância do pipe

Meu ponto principal é que não é necessário que você abra interativamente muitas janelas de terminal; você pode fazer com que um script abra muitas caixas de diálogo.

Answer

Algumas ideias em como fazer isso?

Não.

pv tem opções -c e -N que devem permitir que você faça o que quiser

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

mas não consigo ver como aplicar esse recurso a vários pipelines

No entanto, se você olhar a página de manual do pv, verá isto

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

Portanto, você pode estender isso para executar uma série de tarefas em paralelo, desde que seja aceitável visualizar o progresso em um cluster de pequenas janelas. Eu tentaria o Xdialog.

Atualmente, preciso de uma janela de terminal separada para cada instância do pipe

Meu ponto principal é que não é necessário que você abra interativamente muitas janelas de terminal; você pode fazer com que um script abra muitas caixas de diálogo.

Question 2

Você procurou --pipepelo GNU Parallel?

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

(gato incluído para ênfase)

O padrão é o tamanho do bloco de 1 MB, que pode ser ajustado com --block.

-- editar para correspondência 1-1 --

Com base no exposto, você pode obter correspondência 1-1 como esta:

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

(gato incluído para ênfase)

Não é exatamente o ideal, pois o paralelo interno não saberá sobre seus irmãos e, portanto, poderá gerar mais no servidor1 do que no servidor2. Uma maneira de evitá-lo é -j1 no paralelo externo, mas isso não será ideal se o interno tiver blocos suficientes apenas para o primeiro servidor. Em outras palavras: para equilibrar perfeitamente sua carga de trabalho, talvez você precise mexer um pouco nisso - talvez até usar --load 100% ou similar.

--- editar: Lidar com falhas ---

Se process_piperetornar com um erro, deverá tentar novamente o comando mais 2 vezes:

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

Answer

Você procurou --pipepelo GNU Parallel?

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

(gato incluído para ênfase)

O padrão é o tamanho do bloco de 1 MB, que pode ser ajustado com --block.

-- editar para correspondência 1-1 --

Com base no exposto, você pode obter correspondência 1-1 como esta:

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

(gato incluído para ênfase)

Não é exatamente o ideal, pois o paralelo interno não saberá sobre seus irmãos e, portanto, poderá gerar mais no servidor1 do que no servidor2. Uma maneira de evitá-lo é -j1 no paralelo externo, mas isso não será ideal se o interno tiver blocos suficientes apenas para o primeiro servidor. Em outras palavras: para equilibrar perfeitamente sua carga de trabalho, talvez você precise mexer um pouco nisso - talvez até usar --load 100% ou similar.

--- editar: Lidar com falhas ---

Se process_piperetornar com um erro, deverá tentar novamente o comando mais 2 vezes:

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

Como posso executar vários trabalhos de shell paralelos e monitorar todos eles de uma vez?

Responder1

Responder2

informação relacionada