
「mon osd down out」に推奨される値はありますか? クラスターには 15 個のノードと 300 個の osd があります。ceph Jewl を実行しています。
Jewel のデフォルト値は 300 秒です。デフォルト値を変更すると、何か利点や欠点があるのでしょうか?
答え1
デフォルトは 600 秒に増加されましたが、どのリリースから増加されたかはわかりません。値を変更するのは、現在の構成で問題が発生した場合にのみ意味があります。計画メンテナンス以外にも、サーバーに発生する可能性のある多くのことがあり、noout
サーバーがダウンしている (または単一の OSD) ときに再バランス調整を防ぐためにフラグを設定する必要があります (設定する必要があります)。たとえば、OSD が何らかの理由で失敗し、 とマークされているとしますdown
。現在の構成では、5 分以内に再起動するか、マークされてout
その OSD からの PG の再マッピングがトリガーされ、ドレインされます。単一のサービスを 5 分以内に再起動するのはそれほど悪くないように思えますが、複数の OSD を持つサーバー全体を復旧する必要がある場合は、さらに長い時間がかかる可能性があります。ただし、値が低いと、mon_osd_down_out_interval
「OSD のフラッピング」が発生し、クラスターではるかに多くの問題が発生する可能性があります。これが、デフォルトを 10 分に増やした主な理由だと思います。
一方、クラスターが十分に大きく、クラッシュ ルールとレプリカが適切に構成されている場合は、クライアントに気付かれずにいくつかの OSD を失ってもかまいません。実際のハードウェアにも依存するため、基本的にクラスター管理者が考えられるシナリオを把握する必要があります。サーバーの再起動に 15 分以上かかる顧客がいます。カーネル クラッシュなど、再起動をトリガーする何かが発生した場合を想像してください。サーバーは間隔内に復帰せず、大規模な再マッピングが発生します。これらのケースは、mon_osd_down_out_interval を調整することで、より適切に制御できます。