
Ich stehe vor einem Problem, bei dem slurmctld und slurmd nicht synchron sind, was die Verwendung derselben slurm.conf-Datei betrifft. Daher haben wir Folgendes:
error: Node node1 appears to have a different slurm.conf than the slurmctld. This could cause issues with communication and functionality. Please review both files and make sure they are the same. If this is expected ignore, and set DebugFlags=NO_CONF_HASH in your slurm.conf.
error: Node node2 appears to have a different slurm.conf than the slurmctld. This could cause issues with communication and functionality. Please review both files and make sure they are the same. If this is expected ignore, and set DebugFlags=NO_CONF_HASH in your slurm.conf.
error: Node node3 appears to have a different slurm.conf than the slurmctld. This could cause issues with communication and functionality. Please review both files and make sure they are the same. If this is expected ignore, and set DebugFlags=NO_CONF_HASH in your slurm.conf.
error: Node node4 appears to have a different slurm.conf than the slurmctld. This could cause issues with communication and functionality. Please review both files and make sure they are the same. If this is expected ignore, and set DebugFlags=NO_CONF_HASH in your slurm.conf.
Gibt es eine Möglichkeit (außer der Analyse von Protokollfehlern), slurmctld/slurmd abzufragen?individuellüber die Konfigurationen, auf denen sie laufen, um zu wissen, ob eine davon neu gestartet oder neu konfiguriert werden muss? Ich würde annehmen, dass es ausreichen sollte, einen Hash zu erhalten, um sie miteinander zu vergleichen.
slurm.conf
Update: Es wäre auch praktisch, den Zeitpunkt zu kennen, zu dem die Datei gelesen wurde.
Antwort1
Ich würde vorschlagen,ohne Konfigurationin der Slurm-Konfiguration. Sie erhalten beim Start der Daemons immer noch Fehlermeldungen in den Slurm-Protokollen, diese können jedoch ignoriert werden. Alle Slurmd-Systeme ziehen die richtige Konfiguration vom Slurm-Controller.