ESX 4.0 スペース: DASD、NAS、それとも?

ESX 4.0 スペース: DASD、NAS、それとも?

管理を改善するために ESX ボックスを組み立てましたが、そのパフォーマンスは WTF アイテムです。私は ESX の扱いについては初心者なので、これを整理して .NET プログラミングに戻れるようにするのに役立つ膨大な読み物のリストを探しています。

現在のストレージシステム:

Dell 2910 の PERC6i で Raid5+Hotspare (8x500 GB スピンドル) を実行しています。ESX の制限により、PERC はストレージを 1x2TB + 1x800GB の「パーティション」として表示しています。セットアップの構成 (ストライド / ストライプ / ???) がまったくわかりません。

当社のアプリケーション

当社には SBS サーバーと、マイナーな (2x50 GB、ただし 10 GB/月で増加中) データベース サーバーがあります...

データベース VM 上で稼働するアプリケーションは、CPU と I/O を重視しており、データベースを頻繁に変更する作業と、大量のデータ計算が混在しています (そのパフォーマンスを修正することが、私が取り組むべき作業です)...

パフォーマンスの問題

バックアップ、復元、またはさらに悪いことに (1 つの VM から別の VM にバックアップをコピーして QA VM に移動する)、システム全体の速度が極端に低下します (「無関係な」VM であっても)。

当初は、PCI-x 帯域幅があるので DASD の状況は非常に良好だと思っていましたが、システム全体の速度低下により生産性が低下しています。

質問

  1. NAS、RAID、SAN、DASD について賢明な決定を下すにはどうすればよいでしょうか?
  2. ストレージ設定には良い点と悪い点がありますか?
  3. ESX で tempdb に SSD PCI-X カードを使用できますか? 良いアイデアですか、悪いアイデアですか?
  4. コピーオンライト方式でイメージを「共有」する方法はありますか? 「バックアップ-コピー-リストア」のほとんどは「クリーンなイメージを開発ボックスに配置」することです。マスター イメージを「共有」できれば、「大きなコピー」(2x50 GB) は、開発者ごとに週に 1 回ではなく、週に 1 回実行するだけで済みます...[実行時のパフォーマンスは開発ボックスでは問題になりませんが、バックアップ/コピー/リストアによって、運用、SBS、およびボックス上の他のすべてが停止します]

答え1

ESX サーバーの仕様 (CPU の数、RAM の量、実行している VM の数、その構成と予想されるパフォーマンス要件) の詳細が提供されていないため、現時点ではそれらはすべて問題がなく、発生している問題は間違いなくストレージ IO に関連するものであると想定しています。少なくとも、アクティブな VM をすべて競合なしで実行できるだけのコアと RAM が必要です。また、VM を停止したりディスクにページ アウトさせたりすることなく、ハイパーバイザーが必要なすべての処理を実行できるだけの十分な容量を確保するための余裕が必要です。また、Frederic が述べたように、VMware Tools がインストールされている必要があります。データ ドライブに準仮想化 SCSI アダプターを使用できる場合は役立ちます。

質問 [1] - DAS\RAID\NAS\SAN

ワークロードを互いに分離するには、より多くの IO とより独立した IO を提供する必要があります。NAS\DAS\SAN のいずれを選択する場合でも、別々の RAID パック (できれば RAID 10) を設定する必要があります。ご使用の IO スタイルでは、RAID 5 よりも RAID 10 の方がパフォーマンス上の利点があります (同じ数のフィスクで書き込み IO パフォーマンスが 2 倍)。特に QA 手順によってストレージに深刻な負荷がかかる可能性がある場合は (そうなると思いますが)、主要な IO 集中型 VM が QA システムとは別のデータストアから実行されるようにしてください。現在の 8 ドライブ パックを 4 ドライブずつ 2 つの別々の RAID 10 パックに分割すると、非常に役立ちます。既存の 8 ドライブ RAID 5 パックを RAID 10 に変更し、QA システム用に独立したストレージを追加すると、さらに効果的です。これらすべてを直接接続ストレージで実行できますが、SAN やハイエンド NAS システムを使用するとパフォーマンスが向上します。ただし、これらのシステムにはかなりのコストがかかります。

質問 [2] 既存のストレージの優れた点と欠点

平均的な Windows サーバー (SQL、SBS、Exchange ではなく、ファイル、印刷、DC、低 IO アプリケーション ボックス) を 10 ~ 15 台実行するには十分なディスクがありますが、現在のセットアップでは、本当に IO を集中的に使用するマシンを 1 台以上実行するには十分ではありません。問題なのは、すべてに対して単一の RAID 5 パックを使用していることです。既存のドライブが SATA の場合、最高でも 7200rpm になる可能性が高いため、これは適切ではありません。10kSAS ドライブに移行すると、同じスピンドル数でパフォーマンスがほぼ 2 倍になり、15k ドライブでは 3 倍になります。

質問[3] PCI-X SSDの使用

私の知る限り、ESX は PCI-X\PCI-e SSD をサポートしていませんが、サポートしている場合は、IO が集中する VM ボリュームの場所として役立ちます。tempDB の実行に関しては、理想的には高速ストレージ上の VMDK に配置する必要がありますが、まず VM が効果的に使用できるだけの RAM を備えていることを確認する必要があります。

質問[4]共有画像オプション

VMware Lab Manager はこのような処理を実行しますが、完全にライセンスされた VI インフラストラクチャと、クラスタ内の各サーバの CPU ライセンスが必要です。これは管理に役立ち、QA コピーの使用例にいくつかの潜在的な利点がありますが、パフォーマンスの問題の解決には役立たない可能性もあります。QA システムが IO の観点からハードに駆動されている場合、単一のベース イメージから複数のシステムをプロビジョニングするために使用される Copy-On-Write\delta コピー アプローチは、一般的なパフォーマンスの問題の解決には役立たず、おそらく問題を悪化させるでしょう。ただし、これによりコピーの作成がはるかに簡単かつ迅速になります。

答え2

あなたの問題は DAS や NAS ではなく、CRAP DISCS に関連しています。多くの VM は、通常のコンピュータよりも IO がはるかに多くなります。使用パターンが本当に低い場合を除き、ここでは FAST ディスクの使用が必須です。

  • 優れた RAID コントローラ (Adaptec 製品) と十分な数のディスクがあれば、DAS システムを使用した小規模なセットアップでも問題ありません。
  • SAN (NAS ではありません) には、複数のボックス間で共有できるという利点があります (フェイルオーバー、クラスタリングなど)。

いずれにせよ、大量の IO が必要になります。ルールは次のとおりです。

  • VM はページ ファイルを使用しないでください。ページングは​​ディスクに負担をかけます。いずれにしても、ディスクは厳しい制限となります。
  • RAID 5 は RAID 10 よりもずっと遅いです ;)
  • 500 GB ディスクはおそらく最大 7200 RPM ですが、これは遅いです。最低 10,000 RPM の SAS インフラストラクチャを使用します。300 GB Velociraptor の RAID 10 で非常に良い経験をしました (ただし、新しい 600 GB は少し高速です)。

本当に大量の IO 容量が必要です。RAID 5 は 2 つのディスクよりもわずかに高速です (高速であるかどうかは計算してみなければなりません)。また、特定のシナリオでは 1 つのディスクでも十分高速ではありません。その結果、IO セットアップが機能しなくなります。これは正常です。

8 枚のディスク (500 GB つまり 2 TB) の RAID 10 をインストールすると、RAID 5 を使用する場合よりもはるかに多くの独立した IO 容量が得られます。

答え3

  • (1) および (2) : ローカル ストレージを使用すると、vmware のすべての機能 (ha、ft、vmotion など) を使用できなくなります。私は EQL SAN で iSCSI を使用していますが、iSCSI 実装が悪く (書き込みで約 2Gbps)、raid6 を使用しているため、パフォーマンスが非常に低いです。raid10 を使用すると、IO パフォーマンスが大幅に向上します。したがって、お金に余裕がある場合は、FC SAN を使用するか、raid10 の FCoE SAN を待ちます :)。私の意見では、集中的な IO には、低コストの SAN を使用しないでください。

  • (3)分からない

速度低下を軽減するためにゲスト ツールを設定してみましたか? Oracle データベースでも同じ問題が発生しましたが、ゲスト ツールを設定するとパフォーマンスが大幅に向上しました。また、RHEL で準仮想化 SCSI ドライバーを使用してパフォーマンスをさらに向上させました。

フレデリック

答え4

これがあなたの問題でしょうか?

http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1011213

とにかく、すべての BIOS を更新してください。ディスクは SATA ですか、それとも SAS ですか? スペースから判断すると、SATA だと思います...最速のディスクではありません。最高のパフォーマンスが必要な場合は、RAID 5 ではなく 10 を試してください。NAS、SAN、DAS は 1 つのものです...RAID は、それらのほとんどすべてでベースになっています。簡単に説明します。

NAS: ファイルシステムをエクスポート (nfs、smb)
SAN: ブロックデバイスをエクスポート (iscsi、lun、aoe)
DAS: サーバーに直接接続されているすべてのストレージボックス (scsi、esata)

RAID: ディスククラッシュが発生した場合にシステムの可用性を高める方法です。

関連情報