md raid5 の破棄が非常に遅い

Question 1

テストで実証されているように、RAID5 は確かに単純な RAID 1 アレイよりも集中的な操作です。RAID 1 は文字通り 2 つのディスク間の同期だけだからです。

一方、RAID 5では、3つのディスク間でこの計算をすべて実行する必要があります。そしてそれらをパリティアップします。少なくとも「単純な」RAID 1 アレイと比較すると、これは大変な作業です。

また、補足として、QVO ドライブは、通常ドライブのアクティビティが重要となる VM のサービスなどの負荷には適していません。RAID 5 などのパリティアレイも同様です。その点と RAID 5 自体の状況を考慮して、展開戦略を再検討したほうがよいかもしれません。

Answer

テストで実証されているように、RAID5 は確かに単純な RAID 1 アレイよりも集中的な操作です。RAID 1 は文字通り 2 つのディスク間の同期だけだからです。

一方、RAID 5では、3つのディスク間でこの計算をすべて実行する必要があります。そしてそれらをパリティアップします。少なくとも「単純な」RAID 1 アレイと比較すると、これは大変な作業です。

また、補足として、QVO ドライブは、通常ドライブのアクティビティが重要となる VM のサービスなどの負荷には適していません。RAID 5 などのパリティアレイも同様です。その点と RAID 5 自体の状況を考慮して、展開戦略を再検討したほうがよいかもしれません。

Question 2

私もこの問題に取り組みました。raid5 のドライバーを詳しく調べたところ、raid5 は受信した破棄要求を基盤デバイス上の 4k 破棄要求に分割していることがわかりました。さらに、これはかなり前から壊れていたため、実質的に devices_handle_discard_safely を無視しています。その結果、すべての 4k 破棄は基盤デバイスと同期して行われるため、全体としてさらに遅い操作になります。補足: この問題については近々 LKML に取り上げますので、そちらでご確認ください。既存のカーネルで利用できる回避策についてはよく知りません。

Answer

私もこの問題に取り組みました。raid5 のドライバーを詳しく調べたところ、raid5 は受信した破棄要求を基盤デバイス上の 4k 破棄要求に分割していることがわかりました。さらに、これはかなり前から壊れていたため、実質的に devices_handle_discard_safely を無視しています。その結果、すべての 4k 破棄は基盤デバイスと同期して行われるため、全体としてさらに遅い操作になります。補足: この問題については近々 LKML に取り上げますので、そちらでご確認ください。既存のカーネルで利用できる回避策についてはよく知りません。

md raid5 の破棄が非常に遅い

答え1

答え2

関連情報