複数の並列シェルジョブを実行し、それらすべてを一度に監視するにはどうすればよいですか?

Question 1

これを実行する方法について何かアイデアはありますか?

いいえ。

pvには-cと-Nオプションがあり、これを使えば望みどおりのことができるはずです。

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

しかし、その機能を複数のパイプラインに適用する方法がわかりません

しかし、pvのマニュアルページを見ると、次のことがわかります。

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

したがって、小さなウィンドウのクラスターで進行状況を表示することが許容される限り、これを拡張して、複数のタスクを並行して実行することができます。Xdialog を試してみます。

現在、パイプの各インスタンスごとに別のターミナルウィンドウが必要です。

私が言いたいのは、対話的に多数のターミナルウィンドウを開く必要はなく、 1 つのスクリプトで多数のダイアログボックスを開くことができるということです。

Answer

これを実行する方法について何かアイデアはありますか?

いいえ。

pvには-cと-Nオプションがあり、これを使えば望みどおりのことができるはずです。

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

しかし、その機能を複数のパイプラインに適用する方法がわかりません

しかし、pvのマニュアルページを見ると、次のことがわかります。

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

したがって、小さなウィンドウのクラスターで進行状況を表示することが許容される限り、これを拡張して、複数のタスクを並行して実行することができます。Xdialog を試してみます。

現在、パイプの各インスタンスごとに別のターミナルウィンドウが必要です。

私が言いたいのは、対話的に多数のターミナルウィンドウを開く必要はなく、 1 つのスクリプトで多数のダイアログボックスを開くことができるということです。

Question 2

--pipeGNU Parallel を調べましたか?

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

（強調のため猫も含めます）

デフォルトのブロックサイズは 1 MB ですが、--block で調整できます。

-- 1-1 対応の編集 --

上記に基づいて、次のような 1 対 1 対応が得られます。

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

（強調のため猫も含めます）

これは最適とは言えません。内側の並列処理は兄弟処理を認識しないため、server2 よりも server1 で多くの処理が実行される可能性があるからです。これを回避する 1 つの方法は、外側の並列処理で -j1 を使用することですが、内側の並列処理に最初のサーバー用のブロックしかない場合は最適ではありません。言い換えると、ワークロードのバランスを完全に取るには、これを少し調整する必要があるかもしれません。場合によっては、--load 100% などを使用する必要があるかもしれません。

--- 編集: クラッシュに対処する ---

エラーが返された場合はprocess_pipe、コマンドをさらに 2 回再試行する必要があります。

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

Answer

--pipeGNU Parallel を調べましたか?

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

（強調のため猫も含めます）

デフォルトのブロックサイズは 1 MB ですが、--block で調整できます。

-- 1-1 対応の編集 --

上記に基づいて、次のような 1 対 1 対応が得られます。

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

（強調のため猫も含めます）

これは最適とは言えません。内側の並列処理は兄弟処理を認識しないため、server2 よりも server1 で多くの処理が実行される可能性があるからです。これを回避する 1 つの方法は、外側の並列処理で -j1 を使用することですが、内側の並列処理に最初のサーバー用のブロックしかない場合は最適ではありません。言い換えると、ワークロードのバランスを完全に取るには、これを少し調整する必要があるかもしれません。場合によっては、--load 100% などを使用する必要があるかもしれません。

--- 編集: クラッシュに対処する ---

エラーが返された場合はprocess_pipe、コマンドをさらに 2 回再試行する必要があります。

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

複数の並列シェルジョブを実行し、それらすべてを一度に監視するにはどうすればよいですか?

答え1

答え2

関連情報