OpenNebula (KVM) + OpenvSwitch、高帯域幅使用時の CPU 負荷が高い

Question 1

仮想ブリッジを経由する必要があるものはすべて、かなり大きな影響を受けます。これは、ovs と Linux ブリッジングに当てはまります。どちらも、どこに送信する必要があるかを判断するために、無差別モードでパケット検査を実行する必要があるためです (基本的には、レイヤー 2 スイッチ)。

10Gib イーサネットなどの高パフォーマンスシナリオでは、ホスト OS にレイヤー 2 で切り替えさせるよりも、srv-io デバイスパススルーを実行する方が賢明な場合があります。ただし、パスされたイーサネットカードを使用できるのは 1 つのゲストのみという欠点があります。PCI パススルーはネットワークカードに非常に適しており、KVM / libvirt はこの点で優れています。

Macvtap は、オーバーヘッドをほとんどかけずに、srv-io PCI パススルーを使用せずに、トラフィックをゲスト VM に直接渡すこともできます (そのため、単一の VM にハードウェアを専用にする必要はありません)。Macvtap には、ホストからゲストへの通信、または同じハイパーバイザー内でのゲストからゲストへの通信さえも提供できないという制限があります (仮想スイッチ上の各ゲストに異なる MAC アドレスを使用するのではなく、ホストの同じ MAC アドレスを使用するため)。これを回避する 1 つの方法は、スイッチレベルで「ヘアピン」を実行することです (スイッチがサポートしている場合)。これにより、デバイスは単一のポートと単一の MAC アドレスで一種のループバックを介して自分自身と通信できるようになります。

上で述べたいずれかの方法を使用する場合、ホストとゲストの相互通信では、高パフォーマンス通信に使用されない専用の追加のブリッジネットワークを提供するのが一般的です。これは、VM で >=10Gib イーサネットを使用する場合の非常に一般的な構成です。

Answer

仮想ブリッジを経由する必要があるものはすべて、かなり大きな影響を受けます。これは、ovs と Linux ブリッジングに当てはまります。どちらも、どこに送信する必要があるかを判断するために、無差別モードでパケット検査を実行する必要があるためです (基本的には、レイヤー 2 スイッチ)。

10Gib イーサネットなどの高パフォーマンスシナリオでは、ホスト OS にレイヤー 2 で切り替えさせるよりも、srv-io デバイスパススルーを実行する方が賢明な場合があります。ただし、パスされたイーサネットカードを使用できるのは 1 つのゲストのみという欠点があります。PCI パススルーはネットワークカードに非常に適しており、KVM / libvirt はこの点で優れています。

Macvtap は、オーバーヘッドをほとんどかけずに、srv-io PCI パススルーを使用せずに、トラフィックをゲスト VM に直接渡すこともできます (そのため、単一の VM にハードウェアを専用にする必要はありません)。Macvtap には、ホストからゲストへの通信、または同じハイパーバイザー内でのゲストからゲストへの通信さえも提供できないという制限があります (仮想スイッチ上の各ゲストに異なる MAC アドレスを使用するのではなく、ホストの同じ MAC アドレスを使用するため)。これを回避する 1 つの方法は、スイッチレベルで「ヘアピン」を実行することです (スイッチがサポートしている場合)。これにより、デバイスは単一のポートと単一の MAC アドレスで一種のループバックを介して自分自身と通信できるようになります。

上で述べたいずれかの方法を使用する場合、ホストとゲストの相互通信では、高パフォーマンス通信に使用されない専用の追加のブリッジネットワークを提供するのが一般的です。これは、VM で >=10Gib イーサネットを使用する場合の非常に一般的な構成です。

Question 2

私がうまく（そして簡単に、NICなどを交換することなく）適用できた大きな最適化の1つは、VMテンプレート内のすべてのNICに対して、または各NICごとに個別に、デフォルトでvirtioモデルを使用することです。ここ:

NIC_DEFAULT = [
  MODEL = "virtio" ]

すでにインスタンス化されている VM の場合は、シャットダウンし、すべての NIC を切断して、「virtio」モデルで再接続します。

最初のテストでは、ホストとゲスト間の iperf3 帯域幅が 5.6 Gbps に増加し、テスト中にホスト CPU 負荷が qemu スレッドごとに約 50 ～ 60 % に減少しました (Gbit 接続ホストから iperf3 クライアントを実行してほぼ 1 Gbps で 5 % 未満)。

さらなる最適化についてご存知の場合は、遠慮なく追加してください。

Answer

私がうまく（そして簡単に、NICなどを交換することなく）適用できた大きな最適化の1つは、VMテンプレート内のすべてのNICに対して、または各NICごとに個別に、デフォルトでvirtioモデルを使用することです。ここ:

NIC_DEFAULT = [
  MODEL = "virtio" ]

すでにインスタンス化されている VM の場合は、シャットダウンし、すべての NIC を切断して、「virtio」モデルで再接続します。

最初のテストでは、ホストとゲスト間の iperf3 帯域幅が 5.6 Gbps に増加し、テスト中にホスト CPU 負荷が qemu スレッドごとに約 50 ～ 60 % に減少しました (Gbit 接続ホストから iperf3 クライアントを実行してほぼ 1 Gbps で 5 % 未満)。

さらなる最適化についてご存知の場合は、遠慮なく追加してください。

OpenNebula (KVM) + OpenvSwitch、高帯域幅使用時の CPU 負荷が高い

答え1

答え2

関連情報