タスクを特定のノードでのみ実行するように制限する方法はありますか?

Question

いいえ、これは Swarm Mode に組み込まれた機能ではありません。

現在利用可能な唯一の配置設定は、ラベルの値全体にワークロードを分散することです。これは、すべてのレプリカが単一のアベイラビリティゾーンにスケジュールされるのを回避するために使用されます (たとえば、すべてのワークロードが同じラック、データセンターなどにあるなど)。ソフト制約のように機能する配置設定はありません。

スウォームスケジューリングで利用できるもう 1 つのオプションは制約であり、これは厳格な制限です。制約に一致しないノードではワークロードはスケジュールされません。これは、ワークロードがどこにもスケジュールできず、サービスがダウンしたままになることを意味します。

目的に最も近い方法は、他のすべてのデータセンターの停止を検出し、サービスの制約を調整する追加プロセスを実行することですが、それには 2 つの関連する問題が発生すると思われます。まず、他のデータセンターが停止すると、マネージャーとのクォーラムが失われる可能性が高く、スケジュールアクティビティは発生せず、実行中のマネージャーへのコマンドはリーダーの喪失により失敗します。次に、クォーラムがある場合、残りのデータセンターのノードは、再スケジュールされている他のワークロードによって過剰にプロビジョニングされる可能性があります。これは、コンテナーに CPU とメモリの要件を設定する必要がある、サンダーリングハード問題として知られています。これらの要件により、ノードでの新しいジョブのスケジュールがブロックされ、さらなる停止が回避され、変更されたサービスが容量のあるノードを見つけられなくなります。

Answer 1

いいえ、これは Swarm Mode に組み込まれた機能ではありません。

現在利用可能な唯一の配置設定は、ラベルの値全体にワークロードを分散することです。これは、すべてのレプリカが単一のアベイラビリティゾーンにスケジュールされるのを回避するために使用されます (たとえば、すべてのワークロードが同じラック、データセンターなどにあるなど)。ソフト制約のように機能する配置設定はありません。

スウォームスケジューリングで利用できるもう 1 つのオプションは制約であり、これは厳格な制限です。制約に一致しないノードではワークロードはスケジュールされません。これは、ワークロードがどこにもスケジュールできず、サービスがダウンしたままになることを意味します。

目的に最も近い方法は、他のすべてのデータセンターの停止を検出し、サービスの制約を調整する追加プロセスを実行することですが、それには 2 つの関連する問題が発生すると思われます。まず、他のデータセンターが停止すると、マネージャーとのクォーラムが失われる可能性が高く、スケジュールアクティビティは発生せず、実行中のマネージャーへのコマンドはリーダーの喪失により失敗します。次に、クォーラムがある場合、残りのデータセンターのノードは、再スケジュールされている他のワークロードによって過剰にプロビジョニングされる可能性があります。これは、コンテナーに CPU とメモリの要件を設定する必要がある、サンダーリングハード問題として知られています。これらの要件により、ノードでの新しいジョブのスケジュールがブロックされ、さらなる停止が回避され、変更されたサービスが容量のあるノードを見つけられなくなります。

タスクを特定のノードでのみ実行するように制限する方法はありますか?

答え1

関連情報