2주 만에 3ware raid에서 디스크 3개에 ECC 오류 발생

2주 만에 3ware raid에서 디스크 3개에 ECC 오류 발생

클라이언트용으로 유지 관리하는 서버가 있습니다. Intel Nehalem 기반 컴퓨터이므로 새 것은 아니지만 정상적으로 작동합니다. 20개의 드라이브가 연결되어 있고 4개의 빈 슬롯이 있으며 5개의 raid5 어레이로 구성된 3ware 9650SE-24M8 카드가 있습니다. 이 어레이 중 3개는 2TB 드라이브로 구성되고 나머지 2개는 3TB 드라이브로 구성됩니다. 지난 2주 동안 우리는 같은 어레이에서 3개의 3TB 드라이브를 잃어버렸습니다. 그 중 두 개는 같은 날에 분실되었습니다. 야간 백업을 수행하므로 데이터 손실은 없지만 교체 디스크와 마찬가지로 가동 중지 시간이 많이 소요됩니다. 분실이란 카드가 보고되고 ECC 오류 상태를 의미합니다. 2TB 드라이브는 작동 시간이 25,000시간에 가까워지고, 3TB 드라이브는 작동 시간이 10,000시간에 가까워집니다.

주변 온도는 대략 25C이고 드라이브는 (스마트에 따르면) 약 28-30C에서 유휴 상태입니다. 운영 체제는 fedora Linux 13 amd64입니다(6개월 동안 업그레이드하려고 노력했지만 준비가 되었다고 느낄 만큼 안정적으로 작동할 수는 없습니다).

나는 이 시점에서 무엇을 해야 할지 모르겠습니다. 지금까지 두 개의 드라이브가 사망했습니다. 둘 다 1TB이고 꽤 오래되었으며 몇 달 간격으로 사망했습니다. 도움이나 제안이 있나요?

관련 정보