
저는 RAID-Z2 구성의 2TB Seagate Barracuda ST2000DM006 드라이브로 구성된 8개의 드라이브가 포함된 FreeNAS(11.2-U8) 서버를 집에 설치했습니다.
나머지 시스템 하드웨어는 다음과 같습니다.
- CPU: Intel(R) Core(TM) i3-4170 CPU @ 3.70GHz
- 전원 공급 장치: EVGA 100-W1-0500-KR
- 마더보드: ASRock C226 (ECC 가능)
- 램: NEMIX RAM 16GB(2 x 8GB) DDR3-1066MHz PC3-8500(ECC)
이 설정은 2.5년 동안 문제 없이 실행되었으며 그 후 포트 ADA7에 연결된 하드 디스크에 SATA 오류가 발생하기 시작했습니다. 제 생각엔 2.5년이 짧다고 생각해서 드라이브를 보증 기간이 더 긴 "NAS 등급" 드라이브로 교체하기로 결정하고 WD Red Pro WD2002FFSX를 구입했습니다.
풀을 성공적으로 리실버링한 후 단 며칠의 작업 후에 이 새 드라이브에서 동일한 유형의 SATA 오류가 발생하기 시작했습니다.
케이블이 의심되기 시작하여 SATA 케이블의 한쪽 끝을 ADA6 및 ADA7 드라이브에서 전환하여 문제가 있는 드라이브를 ADA6에 연결했습니다. 오류는 계속 표시되었지만 현재는 ADA6에 있습니다. 케이블 불량이나 마더보드 포트 문제의 가능성을 제거합니다.
해당 포트의 모든 것을 다시 연결한 후 ADA6 및 ADA7의 전원 케이블을 전환했습니다. ADA7에 오류가 여전히 존재한다는 것은 전원 케이블이 깨끗하다는 것을 의미합니다.
그렇다면 디버깅의 다음 단계는 무엇입니까? 나는 이 문제에 대한 전문가가 아니며 매우 운이 좋지 않아 두 개의 불량 드라이브가 있거나 다른 일이 일어나고 있는데 그것이 무엇인지 전혀 모르는 것 같습니다.
내가 얻는 오류는 다음과 같습니다.
Device: /dev/ada7, ATA error count increased from 2960 to 2961
Device: /dev/ada7, not capable of SMART self-check
Pool main state is DEGRADED: One or more devices has experienced an unrecoverable error. An attempt was made to correct the error. Applications are unaffected.
모든 하드 드라이브는 SMART를 지원한다는 점을 언급하고 싶습니다. 가끔 NAS가 며칠 동안 문제 없이 실행되다가 문제를 보고하는 이메일을 반복적으로 보내기 시작합니다. 정말 산발적인 행동입니다.
답변1
나는 이것이 소프트웨어 문제라고 생각합니다. 정확히 알 수는 없지만 NAS에서 가능한 모든 업데이트를 실행하는 것(최신 업데이트 트레인 11.3으로 전환하고 모든 풀 업그레이드 실행)이 성공한 것 같습니다.
모든 것을 업데이트한 이후로 거의 2개월 동안 문제 없이 실행되었습니다.