여러 폴더에서 스크립트를 병렬로 실행

여러 폴더에서 스크립트를 병렬로 실행

상위 레벨 디렉토리 내에 여러 하위 디렉토리가 있습니다. 각 하위 디렉터리에는 여러 파일과 for 루프 쉘 스크립트가 있습니다. 각 하위 디렉터리에는 동일한 for 루프 스크립트가 있습니다. 각 하위 디렉터리로 이동하여 여러 터미널에서 for 루프 스크립트를 병렬로 실행하고 싶습니다. 나는 이것을 시도했지만 직렬로(하나씩) 수행되는 것처럼 보이지만 모든 것을 병렬로 실행하고 싶습니다.

find dir_* -type f -execdir sh for_loop.sh {} \;

답변1

이것이 옳은 일이라고 가정합니다 - 연속적으로만:

find dir_* -type f -execdir sh for_loop.sh {} \;

그러면 이를 다음으로 바꿀 수 있습니다.

find dir_* -type f | parallel 'cd {//} && sh for_loop.sh {}'

여러 터미널에서 실행하려면 GNU Parallel은 tmux각 명령을 자체 tmux창에서 실행하도록 지원합니다.

find dir_* -type f | parallel --tmuxpane 'cd {//} && sh for_loop.sh {}'

기본값은 CPU 코어당 하나의 작업입니다. 귀하의 경우 코어 수보다 하나 더 많은 작업을 실행하고 싶을 수도 있습니다.

 find dir_* -type f | parallel -j+1 --tmuxpane 'cd {//} && sh for_loop.sh {}'

GNU Parallel은 일반적인 병렬 처리기이며 동일한 시스템 또는 SSH 액세스 권한이 있는 여러 시스템에서 작업을 병렬로 쉽게 실행할 수 있도록 해줍니다.

4개의 CPU에서 32개의 서로 다른 작업을 실행하려는 경우 병렬화하는 간단한 방법은 각 CPU에서 8개의 작업을 실행하는 것입니다.

간단한 스케줄링

대신 GNU Parallel은 프로세스가 완료되면 새 프로세스를 생성하여 CPU를 활성 상태로 유지하여 시간을 절약합니다.

GNU 병렬 스케줄링

설치

보안상의 이유로 패키지 관리자를 사용하여 GNU Parallel을 설치해야 하지만 GNU Parallel이 배포용으로 패키지되어 있지 않은 경우 루트 액세스가 필요하지 않은 개인 설치를 수행할 수 있습니다. 다음과 같이 하면 10초 안에 완료할 수 있습니다.

$ (wget -O - pi.dk/3 || lynx -source pi.dk/3 || curl pi.dk/3/ || \
   fetch -o - http://pi.dk/3 ) > install.sh
$ sha1sum install.sh | grep 883c667e01eed62f975ad28b6d50e22a
12345678 883c667e 01eed62f 975ad28b 6d50e22a
$ md5sum install.sh | grep cc21b4c943fd03e93ae1ae49e28573c0
cc21b4c9 43fd03e9 3ae1ae49 e28573c0
$ sha512sum install.sh | grep da012ec113b49a54e705f86d51e784ebced224fdf
79945d9d 250b42a4 2067bb00 99da012e c113b49a 54e705f8 6d51e784 ebced224
fdff3f52 ca588d64 e75f6033 61bd543f d631f592 2f87ceb2 ab034149 6df84a35
$ bash install.sh

다른 설치 옵션은 다음을 참조하세요.http://git.savannah.gnu.org/cgit/parallel.git/tree/README

더 알아보기

더 많은 예시 보기:http://www.gnu.org/software/parallel/man.html

소개 동영상 보기:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

튜토리얼을 살펴보세요:http://www.gnu.org/software/parallel/parallel_tutorial.html

지원을 받으려면 이메일 목록에 가입하세요.https://lists.gnu.org/mailman/listinfo/parallel

답변2

아마도 이를 위한 완벽한 도구는 다음과 같습니다.GNU 병렬:

parallel ::: dir_*/for_loop.sh

GNU Parallel은 각 작업을 병렬로 실행할 뿐만 아니라 출력을 역다중화하여 서로 간섭하지 않도록 합니다.

매뉴얼 페이지에서:

GNU 병렬은 하나 이상의 컴퓨터를 사용하여 작업을 병렬로 실행하기 위한 쉘 도구입니다. 작업은 단일 명령일 수도 있고 입력의 각 줄에 대해 실행되어야 하는 작은 스크립트일 수도 있습니다. 일반적인 입력은 파일 목록, 호스트 목록, 사용자 목록, URL 목록 또는 테이블 목록입니다. 작업은 파이프에서 읽는 명령일 수도 있습니다. 그런 다음 GNU 병렬은 입력을 블록으로 분할하고 블록을 각 명령에 병렬로 파이프할 수 있습니다.

오늘 xargs와 tee를 사용한다면 GNU 병렬이 xargs와 동일한 옵션을 갖도록 작성되었으므로 GNU 병렬을 사용하기가 매우 쉽다는 것을 알게 될 것입니다. 쉘에서 루프를 작성하면 GNU 병렬이 대부분의 루프를 대체하고 여러 작업을 병렬로 실행하여 더 빠르게 실행되도록 할 수 있다는 것을 알게 될 것입니다.

GNU 병렬은 명령의 출력이 명령을 순차적으로 실행했을 때 얻을 수 있는 것과 동일한 출력인지 확인합니다. 이를 통해 GNU 병렬의 출력을 다른 프로그램의 입력으로 사용할 수 있습니다.

답변3

find당신을 위해 그렇게하지 않을 것입니다.

다음과 같이 스크립트를 만들고 for_loop.sh 스크립트를 찾아 실행합니다.

#!/bin/bash

for theScript in $(find dir_* -name for_loop.sh); do
  "$theScript" &
done

스크립트가 하위 디렉터리 내에서 실행되어야 한다면 cd이전에 시도해보세요 cd $(dirname "$theScript") && . $(basename "$theScript").

내 예제는 자세히 테스트되지 않았으며 오류를 허용하지 않습니다 ...

편집 1:

처럼사토 카츠라올바르게 주석을 달면 디렉터리 이름에 공백이 있으면 위 스크립트가 중단됩니다.

그래서 루프로 변경했습니다 read.

#!/bin/bash
find dir_* -name for_loop.sh | while IFS= read -r theScript; do
  "$theScript" &
done

답변4

최상위 디렉토리에서 할 수 있습니다

for D in `find . -type d -maxdepth 1`
do 
     $D/<yourScriptName>.sh &
done

"&"는 백그라운드에서 실행하는 것입니다.

관련 정보