Fehler beim Bereitstellen von Ceph Quincy mit ceph-ansible 7 auf Rocky 9

Fehler beim Bereitstellen von Ceph Quincy mit ceph-ansible 7 auf Rocky 9

Ich versuche, Ceph Quincy mit ceph-ansible auf Rocky9 bereitzustellen. Ich habe einige Probleme und weiß nicht, wo ich nach der Ursache suchen soll.

PS: Ich habe die gleiche Bereitstellung auf Rocky8 mit ceph-ansible für die Pacific-Version auf derselben Hardware durchgeführt und es hat perfekt funktioniert.

Ich habe 03 Controllerknoten: mon, mgr, mdss und rgws. Und 27 OSD-Knoten: mit jeweils 04 NVMe-Festplatten (OSD). Ich verwende ein 10-GB-Netzwerk mit Jumbo-Frames.

Die Bereitstellung beginnt ohne Probleme, die 03 Monitore werden korrekt erstellt, dann werden die 03 Manager erstellt, danach werden die OSD vorbereitet und formatiert, bis hierhin funktioniert alles gut, aber wenn die Aufgabe „Warten, bis alle OSD aktiv sind“ gestartet wird, was bedeutet, dass alle OSD-Container in allen OSD-Knoten gestartet werden, geht alles schief, die Monitore verlieren ihren Quorum-Zustand, die Reaktion von ceph -s dauert sehr lange, nicht alle OSDs werden aktiviert und die Bereitstellung schlägt am Ende fehl.

cluster 2023-03-06T12:00:26.431947+0100 mon.controllera (mon.0) 3864 : cluster [WRN] [WRN] MON_DOWN: 1/3 mons down, quorum controllera,controllerc 
cluster 2023-03-06T12:00:26.431953+0100 mon.controllera (mon.0) 3865 : cluster [WRN]     mon.controllerb (rank 1) addr [v2:20.1.0.27:3300/0,v1:20.1.0.27:6789/0] is down (out of quorum)

Der Monitorcontainer in zwei meiner Controllerknoten bleibt bei 100 % CPU-Auslastung.

CONTAINER ID   NAME                   CPU %     MEM USAGE / LIMIT     MEM %     NET I/O   BLOCK I/O        PIDS
068e4e55f299   ceph-mon-controllera   99.91%    58.12MiB / 376.1GiB   0.02%     0B / 0B   122MB / 85.3MB   28  <--------
87730f89420d   ceph-mgr-controllera   0.32%     408.2MiB / 376.1GiB   0.11%     0B / 0B   181MB / 0B       35

Könnte das ein Ressourcenproblem sein? Die Monitorcontainer verfügen nicht über genügend CPU-, RAM- usw. Ressourcen, um alle gestarteten OSDs zu verarbeiten? Wenn ja, wie kann ich das herausfinden und wie kann ich es beheben?

Dank im Voraus.

Grüße.

verwandte Informationen