SGE Automatisch konfigurierte Verbrauchsressource?

Question

Die Lösung, die ich gefunden habe, besteht darin, eine neue parallele Umgebung zu erstellen, die die $pe_slotsZuweisungsregel (siehe man sge_pe) hat. Ich habe die Anzahl der für diese parallele Umgebung verfügbaren Slots auf das Maximum gesetzt, da $pe_slotsdie Slot-Nutzung auf pro Knoten begrenzt ist. Da Starcluster die Slots beim Booten des Clusters einrichtet, scheint dies gut zu funktionieren. Sie müssen auch die neue parallele Umgebung zur Warteschlange hinzufügen. Um es ganz einfach zu machen:

qconf -ap by_node

und hier ist der Inhalt, nachdem ich die Datei bearbeitet habe:

pe_name            by_node
slots              9999999
user_lists         NONE
xuser_lists        NONE
start_proc_args    /bin/true
stop_proc_args     /bin/true
allocation_rule    $pe_slots
control_slaves     TRUE
job_is_first_task  TRUE
urgency_slots      min
accounting_summary FALSE

Ändern Sie auch die Warteschlange (aufgerufen all.qvon Starcluster), um diese neue parallele Umgebung zur Liste hinzuzufügen.

qconf -mq all.q

und ändern Sie diese Zeile:

pe_list               make orte

dazu:

pe_list               make orte by_node

Ich war besorgt, dass aus einem bestimmten Job generierte Jobs auf einen einzigen Knoten beschränkt wären, aber das scheint nicht der Fall zu sein. Ich habe einen Cluster mit zwei Knoten und jeweils zwei Slots.

Ich habe eine Testdatei erstellt, die so aussieht:

#!/bin/bash

qsub -b y -pe by_node 2 -cwd sleep 100

sleep 100

und habe es folgendermaßen ausgeführt:

qsub -V -pe by_node 2 test.sh

Nach kurzer Zeit qstatwird angezeigt, dass beide Jobs auf unterschiedlichen Knoten ausgeführt werden:

job-ID  prior   name       user         state submit/start at     queue                          slots ja-task-ID
-----------------------------------------------------------------------------------------------------------------
     25 0.55500 test       root         r     10/17/2012 21:42:57 all.q@master                       2      
     26 0.55500 sleep      root         r     10/17/2012 21:43:12 all.q@node001                      2

Ich habe auch getestet, 3 Jobs gleichzeitig zu übermitteln, die dieselbe Anzahl von Slots auf einem einzelnen Knoten anfordern, und es werden immer nur zwei gleichzeitig ausgeführt, einer pro Knoten. Das scheint also richtig eingerichtet zu sein!

Answer 1

Die Lösung, die ich gefunden habe, besteht darin, eine neue parallele Umgebung zu erstellen, die die $pe_slotsZuweisungsregel (siehe man sge_pe) hat. Ich habe die Anzahl der für diese parallele Umgebung verfügbaren Slots auf das Maximum gesetzt, da $pe_slotsdie Slot-Nutzung auf pro Knoten begrenzt ist. Da Starcluster die Slots beim Booten des Clusters einrichtet, scheint dies gut zu funktionieren. Sie müssen auch die neue parallele Umgebung zur Warteschlange hinzufügen. Um es ganz einfach zu machen:

qconf -ap by_node