SGE 자동 구성 소모품 리소스?

Question

제가 찾은 해결책은 $pe_slots할당 규칙이 있는 새로운 병렬 환경을 만드는 것입니다(참고자료 참조 man sge_pe). $pe_slots슬롯 사용량을 노드별로 제한하므로 해당 병렬 환경에서 사용할 수 있는 슬롯 수를 최대값과 동일하게 설정했습니다 . starcluster는 클러스터 부팅 시 슬롯을 설정하므로 이 방법이 훌륭하게 작동하는 것 같습니다. 또한 새 병렬 환경을 대기열에 추가해야 합니다. 그래서 이것을 간단하게 만들려면 다음과 같이 하십시오.

qconf -ap by_node

파일을 편집한 후의 내용은 다음과 같습니다.

pe_name            by_node
slots              9999999
user_lists         NONE
xuser_lists        NONE
start_proc_args    /bin/true
stop_proc_args     /bin/true
allocation_rule    $pe_slots
control_slaves     TRUE
job_is_first_task  TRUE
urgency_slots      min
accounting_summary FALSE

all.q또한 이 새로운 병렬 환경을 목록에 추가하려면 대기열(starcluster에 의해 호출됨)을 수정하십시오 .

qconf -mq all.q

다음 줄을 변경하세요.

pe_list               make orte

이에:

pe_list               make orte by_node

특정 작업에서 생성된 작업이 단일 노드로 제한될까 봐 걱정했는데, 그렇지 않은 것 같습니다. 두 개의 노드와 각각 두 개의 슬롯이 있는 클러스터가 있습니다.

다음과 같은 테스트 파일을 만들었습니다.

#!/bin/bash

qsub -b y -pe by_node 2 -cwd sleep 100

sleep 100

다음과 같이 실행했습니다.

qsub -V -pe by_node 2 test.sh

잠시 후 qstat서로 다른 노드에서 실행 중인 두 작업이 모두 표시됩니다.

job-ID  prior   name       user         state submit/start at     queue                          slots ja-task-ID
-----------------------------------------------------------------------------------------------------------------
     25 0.55500 test       root         r     10/17/2012 21:42:57 all.q@master                       2      
     26 0.55500 sleep      root         r     10/17/2012 21:43:12 all.q@node001                      2

또한 단일 노드에서 동일한 수의 슬롯을 요청하는 동시에 3개의 작업을 제출하고 노드당 하나씩, 한 번에 2개만 실행하는 것을 테스트했습니다. 그럼 제대로 설정이 된 것 같네요!

Answer 1