핫 스페어가 있는 Raid 5 또는 핫 스페어가 없는 RAID 10?

핫 스페어가 있는 Raid 5 또는 핫 스페어가 없는 RAID 10?

예, 이것은 "나를 위해 내 일을 해주세요"라는 질문 중 하나입니다. 안타깝습니다 :)

상당한 비용을 들이지 않고 서버에 있는 하드 드라이브 수로는 할 수 있는 작업이 한계에 도달했습니다. 구성할 드라이브가 4개 남았는데 이를 RAID 5로 설정하고 핫 스페어 전용으로 사용하거나 핫 스페어 없이 RAID 10으로 설정할 수 있습니다. 각각의 크기는 동일하며 RAID 5는 충분한 성능을 제공합니다.

저는 RAID 5에 대해 부끄러워하지만 핫 스페어 없이 실행한다는 생각도 마음에 들지 않습니다. 나는 성능 저하에는 그다지 관심이 없지만 시스템에 적절한 중복성이 없는 시간이 얼마나 되는지에 관심이 있습니다. 서버와 드라이브는 13x5 4시간 응답 계약을 따릅니다(비록 가장 가까운 서비스 제공업체가 겨울에 차로 최소 2~3시간 떨어져 있다는 것을 우연히 알고 있지만).

서버에는 또한 핫 스페어로 보호되는 두 개의 RAID 1 어레이가 있다는 점에 유의해야 합니다. 베이가 9개인 드라이브 케이지를 만드는 것은 어떨까요? ㅎ.

답변1

어레이의 다운타임 허용 범위는 얼마입니까? 물리적으로 가깝나요, 아니면 원격 데이터 센터에 있나요? 기본적으로 견딜 수 있다면 콜드 스페어를 사용하면 RAID10을 수행할 수 있습니다. 스페어가 가까이에 있지만 물리적으로 교체해야 합니다. 이것이 허용 가능한 시나리오가 아닌 경우 핫 스페어가 포함된 RAID5가 유일한 답입니다.

드라이브 오류 허용 범위가 1인 두 개의 RAID1 세트가 이미 있으므로 핫 스페어 없이 RAID10으로 전환해도 실제로 얻을 수 있는 것은 없습니다. 전체 어레이는 여전히 단일 드라이브 오류에서만 살아남을 수 있습니다.

답변2

이러한 RAID는 모두 어레이의 동일한 디스크와 컨트롤러를 가정하여 서로 상대적입니다.

  • Raid5: 좋은 읽기 속도, 썩은 쓰기 속도는 RAID가 실패 사이에 재구축할 수 있을 만큼 충분한 시간 동안 오류가 발생하는 경우 이중 디스크 오류에서 살아남을 수 있습니다. (예: 디스크 오류, RAID 재구축, 디스크 오류, 괜찮습니다). 동시에 이중 디스크 오류가 발생하는 경우 오류 중 하나가 핫 스페어가 아닌 이상 SOL입니다. 4개의 디스크 어레이를 사용하면 이중 디스크 오류의 절반이 하루를 망칠 것입니다.

  • Raid6: 읽기 속도는 좋지만 쓰기 속도는 정말 좋지 않습니다. 이중 디스크 장애에도 견딜 수 있습니다. 다른 공격대만큼 일반적으로 구현되지는 않습니다.

  • Raid10: 우수한 읽기 및 쓰기 속도, 모든 단일 디스크 오류에서 살아남을 수 있으며, 잠재적인 이중 디스크 오류의 절반(4개 디스크 RAID의 경우)에서 살아남을 수 있습니다.

  • 3방향 미러 + 핫 스페어: 공간이 훨씬 적고 미러가 한 번 재구축될 만큼 충분한 시간 동안 오류가 발생하는 경우 이중 디스크 오류 및 최대 3개의 디스크 오류를 견딜 수 있습니다. 얼마나 많은 컨트롤러/운영 체제가 이것을 지원하는지 잘 모르겠지만 ZFS 이전에 MD와 함께 Solaris에서 사용했던 기능이었습니다.

이것을 볼 때 걱정해야 할 몇 가지 문제가 있습니다.

  1. 어레이를 재구축하는 데 얼마나 걸리나요? Sun은 일부 상황에서 raid5 어레이를 재구축하는 데 걸리는 시간이 어레이에 있는 디스크의 MTBF보다 길어 디스크 오류로 인해 어레이 오류가 발생한다는 사실을 깨닫고 ZFS 개발을 시작했습니다.

  2. 동일한 제조 로트의 디스크에는 모두 동일한 결함이 있을 수 있습니다(팔레트가 떨어졌거나 너무 많이 넣었을 때).디스크를 만들 때 플래터에 접착제를 바르세요)

  3. RAID 어레이가 복잡할수록 컨트롤러/구현의 소프트웨어도 더 복잡해집니다. 실패한 디스크가 어레이를 죽이는 것처럼 많은 RAID 컨트롤러가 어레이를 죽이는 것을 보았습니다. 나는 개별 디스크가 수년 동안 회전하는 것을 보아왔습니다. 실제로 대부분이 그렇게 합니다. 내가 가진 가장 신뢰할 수 있는 시스템은 구성 요소 오류가 한 번도 발생하지 않고 중복된 것이 없는 상자였습니다. 나는 많은 UPS와 RAID 및 중복(임의의 구성 요소 삽입)으로 인해 시스템이 더욱 복잡해져서 복잡성이 실패의 원인이 되었기 때문에 실패를 일으키는 것을 보았습니다.

당신은 돈을 지불하고 기회를 잡습니다... 문제는,

행운을 느끼시나요??

답변3

나는 CHopper3에 동의하지 않을 것입니다. 이 상황에는 드라이브가 4개만 있으므로 오류 기능은 두 시나리오 모두에서 동일합니다(드라이브 2개). 단, RAID 10을 제외하고 잘못된 2개의 드라이브를 분실하면 실제 문제가 발생하게 됩니다. 또한 다른 RAID에 대한 전역 예비 공간을 확보하면 확실히 추가적인 이점도 있습니다.

답변4

다른 사항도 고려해야 합니다. 각 드라이브의 크기/빠름은 얼마나 됩니까? 1TB SATA 드라이브는 RAID5에서 핫 스페어를 재구축하는 데 하루가 걸리고 두 번째 드라이브 오류가 발생할 가능성이 큽니다.

성능은 문제가 되지 않는다고 하셨지만 RAID5 재구축 중에(특히 쓰기에서) 상당한 성능 저하가 발생하는 것을 보았습니다.

관련 정보