Резервное копирование ZFS с использованием ротационных автономных дисков

Резервное копирование ZFS с использованием ротационных автономных дисков

В настоящее время я нахожусь в процессе настройки приличного домашнего NAS. Главной заботой является целостность данных, поэтому я решил использовать ZFS в качестве файловой системы. К сожалению, это накладывает некоторые требования (точнее, рекомендации) на оборудование, что делает это решение довольно дорогим. Это не позволяет мне реализовать резервное копирование вне офиса на аналогичной системе, поэтому я ищу альтернативное решение.

В идеале у меня было бы три съемных жестких диска, один из которых стоял бы рядом с сервером и подключался бы примерно раз в неделю. Остальные оставались бы вне офиса и время от времени менялись бы. Я знаю, что это представляет риск для новых данных, но я планирую сделать резервную копию альтернативным способом.

Вопрос в том, что мне следует положить на съемные диски. Сначала я думал положить zpoolна каждый и использовать zpool sendи zpool recvобновить их, какздесь. Однако я думаю, что вполне возможно, что диски будут «повреждены», когда мне понадобится вернуть резервную копию, и я хотел бы, чтобы ZFS позаботилась об этом. В идеале все три съемных диска должны быть в зеркальной конфигурации до двух замен дисков назад, что позволит ZFS использовать их все для исправления проблем в старых данных при восстановлении резервной копии. Однако диски никогда не будут подключаться одновременно, поэтому это может быть невозможно. Предоставляет ли ZFS средства для реализации того, что мне нужно, или мне следует использовать другой метод?

решение1

К сожалению, это накладывает некоторые требования (точнее, рекомендации) на оборудование, что делает его довольно дорогим решением. Это не позволяет мне реализовать резервное копирование вне офиса на аналогичной системе, поэтому я ищу альтернативное решение.

Я не знаю ваших точных потребностей в оборудовании и производительности, но учтите, что приличные системы могут быть довольно дешевыми, если вы знаете, что ищете, и можете смириться с некоторыми небольшими недостатками. А именно:

  • Количество необходимой оперативной памяти, которое вы найдете в сети, сильно преувеличено, поскольку оперативная память дешева по сравнению с десятками дисков, а оперативная память имеет решающее значение для производительности (поскольку она используется для ARC и дедупликации). Если вам нужно только заполнить канал Ethernet 1 Гбит/с (~110 МБ/с) и у вас в основном потоковая рабочая нагрузка (то есть диск, а не оперативная память, используется постоянно), достаточно 4–8 ГБ памяти (даже 2 ГБ могут работать).
  • Корпоративные диски с 7200 об/мин, разъемами SAS, низким количеством ошибок и пропускной способностью 200 МБ/с хороши, но на самом деле не так уж и необходимы. Два скромных потребительских диска со скоростью 5200 об/мин могут без проблем заполнить ваш ethernet. Случайное чтение будет медленнее, но у вас также нет сотен клиентов, которые хотят получать доступ к разным файлам каждую секунду.
  • HBA от LSI с 8 портами SAS — надежный выбор, но может быть дорогим. Большинство аппаратных портов SATA на серверных платах от Intel и также довольно надежны. Они также потребляют меньше энергии. Опять же, скорость здесь не имеет значения, так как у вас нет SSD или вы не используете multipathing или extenders.
  • Мощность ЦП почти бессмысленна, все современные серверные ЦП имеют достаточно мощности. Некоторые двухъядерные Celeron в диапазоне 30€ также поддерживают память ECC, кроме того, вы можете использовать маломощные Atom SoC или маломощные двухъядерные или четырехъядерные процессоры от AMD. Эти платы также часто уже имеют 6 портов SATA и PCIe для последующего расширения, а также поддержку от 16 до 64 ГБ памяти, примерно за 300€, включая ЦП, память и блок питания.
  • Кроме того, есть некоторые предложения SoHo-серверов от крупных компаний, таких как Dell или HP, где вы можете получить полный сервер за 300€ (экономия за счет масштаба), включая корпус, диск и гарантию. Возможности расширения ограничены, но 4–6 дисков все еще достаточно.
  • Наконец, если вы живете где-то, где электроэнергия дешева, вы можете рассмотреть бывшее в употреблении корпоративное оборудование. Эти системы быстрые, прочные и дешевые, но также шумные и прожорливые. Вам нужно рассчитать, стоит ли компромисс того.

Однако я думаю, что вполне возможно, что диски "повреждены", когда мне нужно будет вернуть резервную копию, и я хотел бы, чтобы ZFS позаботилась об этом. В идеале все три съемных диска должны быть в зеркальной конфигурации до двух замен дисков назад, что позволит ZFS использовать их все для исправления проблем в старых данных при восстановлении резервной копии.

На мой взгляд, очень маловероятно, что ваша живая система с как минимум двусторонним зеркалом и тремя внешними дисками умрет одновременно. Если одна из резервных копий все еще пригодна для использования, вы потеряете только данные за неделю, что гораздо менее критично (и может быть смягчено, например, дифференциальным онлайн-резервным копированием только недавно измененных файлов).

Но предположим, что это произойдет, и сравним все возможные конфигурации резервного копирования (каждый раз предполагая, что в вашей рабочей системе 2 диска используются в качестве зеркал и все 5 дисков имеют одинаковый размер):

3 независимых диска, send/recv используется для синхронизации данных в 3 пулах

  • Диски не могут исправлять ошибки битов, но они могут их обнаружить, и вы можете восстановить файлы с других дисков.
  • Поскольку они независимы, вы можете хранить их в трех местах и ​​иметь 3 разные резервные копии (касающиеся ошибок пользователей и программных ошибок).
  • Обработка проста, поскольку каждый диск/пул обрабатывается одинаково.

3 диска в качестве зеркал, send/recv используется для синхронизации данных в 1 пул

  • По сути, это полностью автономная система с очень хорошей отказоустойчивостью.
  • С другой стороны, у вас все яйца в одной корзине (кража/пожар).

3 диска как деградировавшие зеркала, как описано в связанном вопросе

  • Ознакомьтесь с ответом по ссылке, чтобы узнать о плюсах и минусах.
  • У вас также есть только одна версия

Итак, подведем итог: все зависит от того, что важнее для ваших потребностей — несколько независимых точек во времени или одна, которая более устойчива к сбоям.

Если вы выберете второе решение, обязательно включите регулярные снимки данных для защиты от таких вещей, как вредоносное ПО для шифрования (которое можно было бы несколько смягчить, имея несколько дисков). Кроме того, обязательно распределите три диска и храните их в разных местах для защиты от пожара/кражи/потери.

Связанный контент