
私たちは、LSI MegaRAID カード (マザーボードに内蔵) から実行される RAID-6 アレイに 6 台の 500GB SATA ドライブを搭載した Fujitsu RX300 S4 サーバーを管理しています。
数週間前、1 台のハード ドライブが故障しているとフラグが立てられました (ドライブ ベイのオレンジ色のライト、MegaRAIDcli ソフトウェアはファームウェア ステータスが「故障」と表示)。ドライブを注文して交換しましたが、再構築を開始した後、別のドライブが故障しているとフラグが立てられました。
この現象はこれまでに 3 回発生しています。2 回は障害のある異なるドライブにフラグが立てられ、1 回は既に交換したドライブにフラグが立てられました。
現時点では、2つのドライブに障害が発生しています。ドライブが実は障害が発生しているかどうか、またはバックプレーンまたは RAID カードに障害があるかどうかを確認します。
これまでにこのような経験をした人はいますか? 次に何をすべきか、何かヒントはありますか? 富士通に問い合わせるつもりですが、どなたか何かアドバイスがあれば教えてください...
答え1
お気の毒です。この種のハードウェアの問題は、デバッグするのに非常にストレスがかかり、面倒です。
2002 年に、私は同様の問題をデバッグする「喜び」を味わいました。「HD を交換しましょう」と何度も繰り返し、同様のサーバーをマッサージした結果、バックプレーンが実際の障害であることがわかりました。しかし、それは IBM サーバーであり、いずれにしてもまったく別の話でした。
可能であれば、「故障した」ドライブを別のサーバーでテストし、そこで正常に機能するかどうかを確認してください。私の直感では、あなたの場合はドライブの問題ではなく、何か他のものが壊れていると思います。ドライブは、そのように壊れることはありません。
答え2
コントローラーに欠陥がある可能性があります。電源が信頼できない可能性があります。SATA ケーブルが不良である可能性があります。単に運が悪かっただけかもしれません。