専用MySQLサーバーのディスクI/Oの比較を探しています

Question 1

注意すべき点は、dd コマンドは OS のファイルシステムキャッシュをバイパスしないということです。つまり、他の状況に応じて結果が異なり、出力サイズが大きくなると (つまり、fs キャッシュが使い果たされると) パフォーマンスが大幅に変化します。

出力ファイルのファイルシステムキャッシュをバイパスするには、「oflag=direct」を追加します。例:

time dd if=/dev/zero of=OUT.tmp bs=1M count=1000 oflag=direct

iflag=direct を使用すると、読み取り用のファイルシステムキャッシュをバイパスできます。

また、パフォーマンスはブロックサイズによって大きく異なります。1M は連続書き込みのテストにはかなり良いトレードオフですが、アプリケーションが 1M ブロックを書き込まない限り、実際のパフォーマンスを表すものにはなりません。

一般的に言えば、これらのスループットの数値はかなりひどいものです。単一の SATA ドライブ (Seagate ES.2 ドライブなど) は、ドライブの開始時に 105 MB/秒のシーケンシャル書き込みでピークに達し、ドライブ全体で約 60 MB/秒を維持します。

最後に、一般的なデータベースの「ベストプラクティス」では、パリティ書き込みによって比較的高いオーバーヘッドが発生するため (実際のパリティ計算自体ではなく、ハードウェアでは比較的安価ですが、新しいパリティを書き出すときに余分な読み取りと書き込みを行う必要があるため)、データベースの基盤システムとして RAID5/6 を避けるように言われています。

Answer

注意すべき点は、dd コマンドは OS のファイルシステムキャッシュをバイパスしないということです。つまり、他の状況に応じて結果が異なり、出力サイズが大きくなると (つまり、fs キャッシュが使い果たされると) パフォーマンスが大幅に変化します。

出力ファイルのファイルシステムキャッシュをバイパスするには、「oflag=direct」を追加します。例:

time dd if=/dev/zero of=OUT.tmp bs=1M count=1000 oflag=direct

iflag=direct を使用すると、読み取り用のファイルシステムキャッシュをバイパスできます。

また、パフォーマンスはブロックサイズによって大きく異なります。1M は連続書き込みのテストにはかなり良いトレードオフですが、アプリケーションが 1M ブロックを書き込まない限り、実際のパフォーマンスを表すものにはなりません。

一般的に言えば、これらのスループットの数値はかなりひどいものです。単一の SATA ドライブ (Seagate ES.2 ドライブなど) は、ドライブの開始時に 105 MB/秒のシーケンシャル書き込みでピークに達し、ドライブ全体で約 60 MB/秒を維持します。

最後に、一般的なデータベースの「ベストプラクティス」では、パリティ書き込みによって比較的高いオーバーヘッドが発生するため (実際のパリティ計算自体ではなく、ハードウェアでは比較的安価ですが、新しいパリティを書き出すときに余分な読み取りと書き込みを行う必要があるため)、データベースの基盤システムとして RAID5/6 を避けるように言われています。

Question 2

これが私の MySQL サーバーからの結果です。これは 64 ビットであり、仮想マシンではないため、実際にどの程度使用されているかはわかりませんが、かなりの違いがあります。

time dd if=/dev/zero of=OUT.tmp bs=1M count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 5.72139 s, 183 MB/s
0.00s user 1.55s system 27% cpu 5.725 total

time dd if=OUT.tmp of=/dev/null bs=1M count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 0.432328 s, 2.4 GB/s
0.00s user 0.45s system 103% cpu 0.436 total

Answer

これが私の MySQL サーバーからの結果です。これは 64 ビットであり、仮想マシンではないため、実際にどの程度使用されているかはわかりませんが、かなりの違いがあります。

time dd if=/dev/zero of=OUT.tmp bs=1M count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 5.72139 s, 183 MB/s
0.00s user 1.55s system 27% cpu 5.725 total

time dd if=OUT.tmp of=/dev/null bs=1M count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 0.432328 s, 2.4 GB/s
0.00s user 0.45s system 103% cpu 0.436 total

Question 3

ほとんどの場合、ランダムIOも比較する必要があります[例：ボニー++] 線形の読み取り/書き込みだけではありません。あるいは、ログを取得してインデックスのない巨大なテーブルに保存する 1 つの大きなデータシンクでしょうか?

dd 'ベンチマーク' の結果

szcapp1:/mnt/big/tmp# time dd if=/dev/zero of=OUT.tmp bs=1M count=1000
time dd if=OUT.tmp of=/dev/null bs=1M count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 4.26186 s, 246 MB/s

real    0m4.563s
user    0m0.001s
sys     0m2.255s
szcapp1:/mnt/big/tmp# time dd if=OUT.tmp of=/dev/null bs=1M count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 0.457162 s, 2.3 GB/s

real    0m0.459s
user    0m0.000s
sys     0m0.459s
szcapp1:/mnt/big/tmp#

Dell PowerEdge 2950 上の 64 ビット Linux、5x デスクトップ 500GB SATA ディスク上の perc6 raid 10。16GB の RAM、2x クアッドコア 2.66GHz。でも、これは意味がありません。このデータは RAID コントローラーのキャッシュメモリの 1/4 に収まり、残りはシステムメモリに収まります。

確かに結果は遅いです。上記の Linux 上で実行されている VM からの結果 [ VMware Server 2.0 の 32 ビット Linux ゲスト ]:

vfeed0:/tmp# time dd if=/dev/zero of=OUT.tmp bs=1M count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 15.996 s, 65.6 MB/s

real    0m16.043s
user    0m0.016s
sys     0m13.117s
vfeed0:/tmp# time dd if=OUT.tmp of=/dev/null bs=1M count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 0.49413 s, 2.1 GB/s

real    0m0.505s
user    0m0.000s
sys     0m0.500s
vfeed0:/tmp#

読み取りパフォーマンスは偽物であることに留意してください。読み取りはキャッシュから行われます。ゲストのキャッシュからでない場合は、おそらく VMware ホストのキャッシュから行われます。

Answer