Führen Sie ein Skript in mehreren Ordnern parallel aus.

Führen Sie ein Skript in mehreren Ordnern parallel aus.

Ich habe mehrere Unterverzeichnisse in einem übergeordneten Verzeichnis. Jedes Unterverzeichnis enthält mehrere Dateien und ein For-Loop-Shell-Skript. In jedem Unterverzeichnis ist dasselbe For-Loop-Skript vorhanden. Ich möchte in jedes Unterverzeichnis gehen und das For-Loop-Skript parallel in mehreren Terminals ausführen. Ich habe das versucht, aber es scheint seriell (nacheinander) zu laufen, aber ich möchte sie alle parallel ausführen.

find dir_* -type f -execdir sh for_loop.sh {} \;

Antwort1

Vorausgesetzt, dies funktioniert richtig – nur in Serie:

find dir_* -type f -execdir sh for_loop.sh {} \;

Dann sollten Sie es durch Folgendes ersetzen können:

find dir_* -type f | parallel 'cd {//} && sh for_loop.sh {}'

Um es in mehreren Terminals auszuführen, unterstützt GNU Parallel tmuxdie Ausführung jedes Befehls in seinem eigenen tmuxBereich:

find dir_* -type f | parallel --tmuxpane 'cd {//} && sh for_loop.sh {}'

Standardmäßig ist ein Job pro CPU-Kern verfügbar. In Ihrem Fall möchten Sie möglicherweise einen Job mehr ausführen, als Sie Kerne haben:

 find dir_* -type f | parallel -j+1 --tmuxpane 'cd {//} && sh for_loop.sh {}'

GNU Parallel ist ein allgemeiner Parallelisierer und erleichtert die parallele Ausführung von Jobs auf derselben Maschine oder auf mehreren Maschinen, auf die Sie per SSH-Zugriff zugreifen können.

Wenn Sie 32 verschiedene Jobs haben, die Sie auf 4 CPUs ausführen möchten, können Sie die Parallelisierung ganz einfach durchführen, indem Sie auf jeder CPU 8 Jobs ausführen:

Einfache Terminplanung

GNU Parallel startet stattdessen einen neuen Prozess, wenn einer fertig ist – wodurch die CPUs aktiv bleiben und Zeit gespart wird:

GNU Parallel-Planung

Installation

Aus Sicherheitsgründen sollten Sie GNU Parallel mit Ihrem Paketmanager installieren. Wenn GNU Parallel jedoch nicht für Ihre Distribution gepackt ist, können Sie eine persönliche Installation durchführen, für die kein Root-Zugriff erforderlich ist. Dies ist in 10 Sekunden erledigt, indem Sie Folgendes tun:

$ (wget -O - pi.dk/3 || lynx -source pi.dk/3 || curl pi.dk/3/ || \
   fetch -o - http://pi.dk/3 ) > install.sh
$ sha1sum install.sh | grep 883c667e01eed62f975ad28b6d50e22a
12345678 883c667e 01eed62f 975ad28b 6d50e22a
$ md5sum install.sh | grep cc21b4c943fd03e93ae1ae49e28573c0
cc21b4c9 43fd03e9 3ae1ae49 e28573c0
$ sha512sum install.sh | grep da012ec113b49a54e705f86d51e784ebced224fdf
79945d9d 250b42a4 2067bb00 99da012e c113b49a 54e705f8 6d51e784 ebced224
fdff3f52 ca588d64 e75f6033 61bd543f d631f592 2f87ceb2 ab034149 6df84a35
$ bash install.sh

Weitere Installationsoptionen finden Sie unterhttp://git.savannah.gnu.org/cgit/parallel.git/tree/README

Erfahren Sie mehr

Weitere Beispiele:http://www.gnu.org/software/parallel/man.html

Sehen Sie sich die Einführungsvideos an:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

Gehen Sie das Tutorial durch:http://www.gnu.org/software/parallel/parallel_tutorial.html

Melden Sie sich für die E-Mail-Liste an, um Unterstützung zu erhalten:https://lists.gnu.org/mailman/listinfo/parallel

Antwort2

Das wahrscheinlich perfekte Werkzeug hierfür istGNU Parallel:

parallel ::: dir_*/for_loop.sh

GNU Parallel führt nicht nur alle Jobs parallel aus, sondern demultiplext auch deren Ausgabe, sodass sie sich nicht gegenseitig stören.

Aus der Manpage:

GNU parallel ist ein Shell-Tool zum parallelen Ausführen von Jobs auf einem oder mehreren Computern. Ein Job kann ein einzelner Befehl oder ein kleines Skript sein, das für jede Zeile in der Eingabe ausgeführt werden muss. Die typische Eingabe ist eine Liste von Dateien, eine Liste von Hosts, eine Liste von Benutzern, eine Liste von URLs oder eine Liste von Tabellen. Ein Job kann auch ein Befehl sein, der aus einer Pipe liest. GNU parallel kann die Eingabe dann in Blöcke aufteilen und einen Block parallel in jeden Befehl weiterleiten.

Wenn Sie heute xargs und tee verwenden, werden Sie feststellen, dass GNU parallel sehr einfach zu verwenden ist, da GNU parallel so geschrieben ist, dass es dieselben Optionen wie xargs bietet. Wenn Sie Schleifen in der Shell schreiben, werden Sie feststellen, dass GNU parallel möglicherweise die meisten Schleifen ersetzen und sie schneller ausführen kann, indem mehrere Jobs parallel ausgeführt werden.

GNU parallel stellt sicher, dass die Ausgabe der Befehle dieselbe ist, die Sie erhalten würden, wenn Sie die Befehle nacheinander ausführen würden. Dadurch ist es möglich, die Ausgabe von GNU parallel als Eingabe für andere Programme zu verwenden.

Antwort3

findwerde das nicht für dich tun.

Erstellen Sie ein Skript, suchen Sie Ihre for_loop.sh-Skripte und führen Sie sie wie folgt aus:

#!/bin/bash

for theScript in $(find dir_* -name for_loop.sh); do
  "$theScript" &
done

Wenn das Skript im Unterverzeichnis ausgeführt werden muss, versuchen Sie es cdvorher, etwa so cd $(dirname "$theScript") && . $(basename "$theScript").

meine Beispiele sind nicht ausführlich getestet und nicht fehlertolerant ...

Bearbeitung 1:

AlsSato KatsuraBei korrekter Kommentierung bricht das obige Skript ab, wenn der Verzeichnisname Leerzeichen enthält.

Also habe ich die Schleife wie folgt geändert read:

#!/bin/bash
find dir_* -name for_loop.sh | while IFS= read -r theScript; do
  "$theScript" &
done

Antwort4

Sie können dies von Ihrem obersten Verzeichnis aus tun

for D in `find . -type d -maxdepth 1`
do 
     $D/<yourScriptName>.sh &
done

das "&" dient dazu, sie im Hintergrund auszuführen

verwandte Informationen