¿Cómo puedo ejecutar varios trabajos de shell paralelos y monitorearlos todos a la vez?

Question 1

¿Alguna idea sobre cómo hacer esto?

No.

pv tiene opciones -c y -N que deberían permitirle hacer lo que quiera

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

pero no veo cómo aplicar esa característica a múltiples canalizaciones

Sin embargo, si miras la página de manual de pv verás esto

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

Por lo tanto, podría ampliar esto para ejecutar varias tareas en paralelo siempre que sea aceptable ver el progreso en un grupo de ventanas pequeñas. Probaría Xdialog.

Actualmente, necesito una ventana de terminal separada para cada instancia de la tubería.

Mi punto principal es que no es necesario que abras interactivamente muchas ventanas de terminal, puedes hacer que un script abra muchos cuadros de diálogo.

Answer

¿Alguna idea sobre cómo hacer esto?

No.

pv tiene opciones -c y -N que deberían permitirle hacer lo que quiera

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

pero no veo cómo aplicar esa característica a múltiples canalizaciones

Sin embargo, si miras la página de manual de pv verás esto

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

Por lo tanto, podría ampliar esto para ejecutar varias tareas en paralelo siempre que sea aceptable ver el progreso en un grupo de ventanas pequeñas. Probaría Xdialog.

Actualmente, necesito una ventana de terminal separada para cada instancia de la tubería.

Mi punto principal es que no es necesario que abras interactivamente muchas ventanas de terminal, puedes hacer que un script abra muchos cuadros de diálogo.

Question 2

¿Buscaste --pipeGNU Parallel?

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

(gato incluido para énfasis)

El tamaño de bloque predeterminado es de 1 MB, que se puede ajustar con --block.

-- editar para correspondencia 1-1 --

Según lo anterior, puede obtener correspondencia 1-1 como esta:

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

(gato incluido para énfasis)

No es del todo óptimo, ya que el paralelo interno no sabrá acerca de sus hermanos y, por lo tanto, puede generar más en el servidor1 que en el servidor2. Una forma de evitarlo es -j1 en el paralelo externo, pero eso no será óptimo si el interno solo tiene suficientes bloques para el primer servidor. En otras palabras: para equilibrar perfectamente tu carga de trabajo, es posible que tengas que modificar un poco esto, tal vez incluso usar --load 100% o similar.

--- editar: lidiar con fallas ---

Si el process_piperesultado es un error, entonces debería volver a intentar el comando 2 veces más:

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

Answer

¿Buscaste --pipeGNU Parallel?

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

(gato incluido para énfasis)

El tamaño de bloque predeterminado es de 1 MB, que se puede ajustar con --block.

-- editar para correspondencia 1-1 --

Según lo anterior, puede obtener correspondencia 1-1 como esta:

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

(gato incluido para énfasis)

No es del todo óptimo, ya que el paralelo interno no sabrá acerca de sus hermanos y, por lo tanto, puede generar más en el servidor1 que en el servidor2. Una forma de evitarlo es -j1 en el paralelo externo, pero eso no será óptimo si el interno solo tiene suficientes bloques para el primer servidor. En otras palabras: para equilibrar perfectamente tu carga de trabajo, es posible que tengas que modificar un poco esto, tal vez incluso usar --load 100% o similar.

--- editar: lidiar con fallas ---

Si el process_piperesultado es un error, entonces debería volver a intentar el comando 2 veces más:

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

¿Cómo puedo ejecutar varios trabajos de shell paralelos y monitorearlos todos a la vez?

Respuesta1

Respuesta2

información relacionada