как работает чередующийся RAID с большим количеством дисков?

как работает чередующийся RAID с большим количеством дисков?

все еще пытаюсь настроить свой большой (24) массив дисков (2,4 ТБ) для архива/NAS смешанных больших и маленьких файлов. Но помимо этого, я теперь больше сосредоточен на том, чтобы понять, как работают чередующиеся RAID-массивы под капотом, но чем больше я читаю, тем больше я запутываюсь, потому что большинство примеров в литературе основаны на «малом» количестве дисков (я спрашивал продюсера, но он не хотел публично отвечать на некоторые из этих вопросов, потому что «зарезервированная информация»)

  • размер полосыобычно (Number of data disks) x (size of strip)(или фрагмент) Например, 8x64КБ=512КБ или 10x256КБ=2560КБ
  • как файлы разделяются и сохраняются вполосаодин файл на полосу (остальные полосы заполняются нулями) или много файлов на полосу, пока не заполнятся все ее полосы?
  • для большого массива размер полосы все еще важен? Я имею в виду, что я обнаружил, что мой PERC использует фиксированное значение 1 МБ для размера полосы, если его значение больше 1 МБ (например, 8x256 КБ). В этом случае, как должна быть организована полоса? она все еще большая, как 8x256 КБ=2 МБ и внутренне разделена на 2x 1 МБ? или она большая, 1 МБ, разделенная на 8 дисков данных?
  • сегодня мне следует настроить чередующийся RAID с учетом "степени двойки"? мой PERC позволяет мне настроить любое количество дисков для любого уровня RAID, которые не являются степенью двойки
  • зная эти ограничения(?), стоит ли устанавливать массив как 2x12Disks RAID60 и размер полосы 256КБ? нам не нужно тратить слишком много места

решение1

как файлы разбиваются и сохраняются в полосу? по одному файлу на полосу (остальные полосы заполняются нулями) или много файлов на полосу, пока все ее полосы не будут заполнены?

Подобные массивы не мыслят в терминах файлов, а только блоков; сама файловая система определяет, какие файлы состоят из каких блоков, а не базовая дисковая система делает это.

Так что не думайте, что файлы — это просто блоки. Представьте себе все файлы в вашей файловой системе, но уберите все данные о папках и файлах. Это просто одна большая куча блоков, и именно эти блоки распределяются по доступным дискам для повышения производительности и устойчивости.

В общем, настройки по умолчанию для файловых систем и RAID-массивов, подобных этой, подойдут для 95% всех приложений. Возможность их настройки великолепна, если у вас есть время поиграться и протестировать все возможные комбинации или если у вас есть приложение с необычными требованиями (например, оно постоянно считывает или записывает либо множество маленьких случайных файлов, либо, с другой стороны, огромные последовательные файлы) — в таких случаях, да, некоторые настройки могут иметь значительные преимущества. Но, опять же, в общем, настройки по умолчанию обычно довольно хороши для большинства случаев использования. Я занимаюсь VoD, поэтому мы часто настраиваем наши тома хранения так, чтобы они имели очень большие полосы/блоки, потому что мы знаем, что все они являются большими последовательными файлами, но тогда мы не помещаем наши файлы БД или журналы и т. д. на эти массивы/тома, потому что они были бы ужасны для этого использования.

Ну ладно, вернемся к рекомендациям. Рад, что вы, похоже, остановились на R60. К нам постоянно приходят люди с проблемами с R5/50. Он мертв. Не используйте его вообще. R6/60 и R1/10 — это единственный выход, если только у вас нет страсти к ZFS :). В любом случае, если бы я этим занимался, я бы сделал именно то, что вы предлагаете. R60 состоит из двух 12-дисковых R6, оставьте настройки полосы по умолчанию, а затем, когда ваше приложение начнет использовать этот массив, вы сможете посмотреть, как он работает. Если вы действительно чувствуете, что вам нужно его настроить, и это принесет большую пользу, то продолжайте, но я уверен, что вас устроят настройки по умолчанию.

Удачи.

Связанный контент