2週間で3ware RAIDのECCエラーが発生したディスク3台

2週間で3ware RAIDのECCエラーが発生したディスク3台

私はクライアントのために保守しているサーバーを持っています。Intel Nehalem ベースのコンピューターなので、新品ではありませんが、正常に動作しています。3ware 9650SE-24M8 カードには 20 台のドライブが接続され、4 つの空きスロットがあり、5 つの RAID5 アレイに構成されています。これらのアレイのうち 3 つは 2TB ドライブで構成され、他の 2 つは 3TB です。過去 2 週間で、同じアレイから 3TB ドライブ 3 台が失われ、そのうち 2 台は同じ日に失われました。夜間にバックアップを取っているので、データが失われることはありませんが、ダウンタイムは高価で、ディスクの交換も高額です。失われたというのは、カードが ECC エラー ステータスを報告していることを意味します。2TB ドライブは 25000 動作時間に近づいており、3TB は 10000 動作時間に近づいています。

周囲温度はおよそ 25 ℃ ですが、ドライブは (スマートによると) 約 28 ~ 30 ℃ でアイドル状態です。オペレーティング システムは fedora Linux 13 amd64 です (6 か月間アップグレードを試みていますが、アップグレードの準備ができるほど動作が安定していません)。

この時点で何をすべきか途方に暮れています。これまでに、1TB でかなり古いドライブが 2 つ故障し、数か月の間隔を置いています。助けや提案はありますか?

関連情報