
Я очень хотел узнать больше о центрах обработки данных, а потом наткнулся на RAID-системы.
Мои вопросы могут быть очень глупыми, пожалуйста, отнеситесь ко мне с пониманием.
Как правило, на любом уровне RAID > 0, например: RAID 5. Как операционная система узнает, на каком диске и в каком блоке расположены фрагменты файла?
Какие метаданные будут храниться для данного файла?
Если он действительно хранит метаданные о файлах... Где физически хранятся эти метаданные (и на каком диске они хранятся)?
Как говорится, RAID 5 может выдержать отказ одного диска, но если диск, содержащий метаданные, выйдет из строя, то все будет потрачено впустую, верно?
Мне хотелось бы узнать жизненный цикл файла, который будет храниться в RAID 5, а также работает ли обновление и как происходит удаление файла?
Содержит ли каждый блок информацию об одном файле или о нескольких файлах?
Могу ли я сделать вывод, что с увеличением уровня RAID параллелизм чтения увеличивается, а производительность записи снижается?
решение1
Какие метаданные будут храниться для данного файла?
RAID не имеет абсолютно никакого отношения кфайлметаданные. Это простодискрасположение и как таковое просто преобразует адрес диска в физический блок.
Метаданные файла — это чисто файловая система, а файловая система располагается поверх раздела на диске. Между файлом и блоком диска существует несколько уровней трансляции. Что касается контроллера диска (RAID-контроллера), то к моменту, когда ему предоставляются данные, относящиеся к «файлу», они уже были сокращены файловой системой и драйверами логических дисков операционной системы до «записи этого блока данных в блок диска с номером X».
RAID организует диски в точном логическом порядке. Контроллер знает такие детали, как количество дисков, размер полосы и порядок полосы диска, и учитывая эти детали, любойлогичныйАдрес блока, переданный ему операционной системой, может быть вычислен и сопоставлен с «диском 2, расположением Y» или чем-то подобным.
Как говорится, RAID 5 может выдержать отказ одного диска, но если диск, содержащий метаданные, выйдет из строя, то все будет потрачено впустую, верно?
Нет. RAID 5 содержит 1 диск (стоимость данных), который является логической суммой других дисков. У вас всегда есть 1 полная копия всех данныхплюсметаданные, которые равны сумме остальных трех дисков.
Disk1 block + disk2 block + disk3 block = redundant (disk4) block
Если один диск выйдет из строя, вы можете перегруппировать сумму так, чтобы получить
Disk1 block + disk2 block + disk4 (redundant) block = disk3 block
Таким образом, вы получаете некоторый уровень отказоустойчивости, распределенный по всем вашим дискам. Если какой-либо случайный диск выйдет из строя, у вас все равно будет доступ к достаточному количеству данных, чтобы заменить этот диск. Надеюсь, вы замените этот диск до того, как выйдет из строя другой, и сможете восстановить его недостающие данные, чтобы полностью восстановить отказоустойчивость.
Математика, лежащая в основе избыточного блока, достойна отдельной статьи, и я бы рекомендовал вам прочитать ее.Страница Википедии о RAIDмассивы, чтобы получить лучшее представление об этом.
Мне хотелось бы узнать жизненный цикл файла, который будет храниться в RAID 5, а также работает ли обновление и как происходит удаление файла?
Содержит ли каждый блок информацию об одном файле или о нескольких файлах?
Файлы — это конструкция файловой системы, которая обрабатывается вашей операционной системой. RAID занимается исключительно дисками и ничего не знает о файлах.
Блок диска может содержать любое количество файлов, размещение данных в блоках на диске полностью зависит от операционной системы.
Контроллер RAID просто представляет интерфейс диска для операционной системы, операционная система записывает в него блоки. Что находится в этих блоках, зависит от операционной системы.
Могу ли я сделать вывод, что с увеличением уровня RAID параллелизм чтения увеличивается, а производительность записи снижается?
Да, в некоторой степени это зависит от используемого уровня RAID, и производительность записи не обязательно снижается в соответствии с ростом производительности чтения. Производительность записи может составлять (скажем) 3/4 производительности чтения в зависимости от задачи.
По сравнению с RAID 4, распределенная четность RAID 5 выравнивает нагрузку выделенного диска четности среди всех членов RAID. Кроме того, производительность записи увеличивается, поскольку все члены RAID участвуют в обслуживании запросов на запись. Хотя это не будет так эффективно, как настройка чередования (RAID 0), поскольку четность все равно должна быть записана, это больше не является узким местом.
Поскольку расчет четности выполняется на всей полосе, небольшие изменения в массиве приводят к усилению записи:В худшем случае, когда необходимо записать один логический сектор, необходимо прочитать исходный сектор и соответствующий сектор четности, исходные данные удаляются из четности, новые данные вычисляются в четности и записываются как новый сектор данных, так и новый сектор четности..