Linux ペースメーカー - スプリットブレインを防ぐ

Question 1

Corosync でトークンタイムアウトを 10 秒以上に設定したことはありませんが、tokenの値を(ミリ秒単位で 120 秒) に増やしたり設定したりすることができます。corosync.conf詳細については、の;セクションで定義する必要があります。120000tokentotem{}corosync.confman corosync.conf

これにより、ネットワークがダウンしたときに Corosync が 120 秒間ノードが停止していると宣言することが防止されます。

Answer

Corosync でトークンタイムアウトを 10 秒以上に設定したことはありませんが、tokenの値を(ミリ秒単位で 120 秒) に増やしたり設定したりすることができます。corosync.conf詳細については、の;セクションで定義する必要があります。120000tokentotem{}corosync.confman corosync.conf

これにより、ネットワークがダウンしたときに Corosync が 120 秒間ノードが停止していると宣言することが防止されます。

Question 2

リソースの監視間隔は（は秒数）で変更できますop monitor interval=Ns。N次に、migration-thresholdリソースのをに設定します。に設定すると、監視間隔で最初の障害が発生するタイミングに応じて、合計で 120 ～ 240 秒の遅延が発生する可能性があることに2注意してください。120s

これには他の注意点があり、適用された失敗カウンターはmigration-threshold成功時にリセットされません。これを行うには、設定するか手動で介入する必要もありますfailure-timeout。

op monitor interval=120s、、migration-threshold=2およびfailure-timeout=121s設定ではresource-stickiness、これが期待どおりの機能を提供し、元のマスターが回復したときに障害カウンターがどのように動作するかを確認するためにテストする必要があります。手動による介入が必要になる可能性がありますが、100%確信はありません。

Answer

リソースの監視間隔は（は秒数）で変更できますop monitor interval=Ns。N次に、migration-thresholdリソースのをに設定します。に設定すると、監視間隔で最初の障害が発生するタイミングに応じて、合計で 120 ～ 240 秒の遅延が発生する可能性があることに2注意してください。120s

これには他の注意点があり、適用された失敗カウンターはmigration-threshold成功時にリセットされません。これを行うには、設定するか手動で介入する必要もありますfailure-timeout。

op monitor interval=120s、、migration-threshold=2およびfailure-timeout=121s設定ではresource-stickiness、これが期待どおりの機能を提供し、元のマスターが回復したときに障害カウンターがどのように動作するかを確認するためにテストする必要があります。手動による介入が必要になる可能性がありますが、100%確信はありません。

Linux ペースメーカー - スプリットブレインを防ぐ

答え1

答え2

関連情報