Нужно ли мне резервное копирование, если у меня есть избыточная система хранения данных с возможностью отката?

Нужно ли мне резервное копирование, если у меня есть избыточная система хранения данных с возможностью отката?

Моя организация недавно купила систему хранения данных. Она имеет 1,5 Петабайта, с RAID6, и есть онлайн-синхронизированное зеркало в другом физическом месте.

Система допускает откат/восстановление файлов, по умолчанию устанавливая срок до 30 дней, но его можно увеличить.

Ведется обсуждение вопроса, нужна ли нам какая-то дополнительная резервная копия для данных, находящихся только в хранилище.

Система имеет очень хороший уровень избыточности, она имеет географическую избыточность и допускает откат в определенной степени, что означает, что мы можем восстановить старые данные или случайно удаленные данные до определенного времени (по умолчанию 30 дней).

Учитывая этот сценарий, имеет ли смысл все еще иметь «традиционное» резервное копирование? Под традиционным я подразумеваю выделенную систему резервного копирования со снимками, которые мы можем восстановить в случае, если что-то пойдет не так.

Действительно ли нам это нужно? Я что-то упускаю? Я просто мыслю традиционно и слишком усердствую?

решение1

То, что вы описываете, имеет важное значение для географически распределенного RAID и RAIDникогда не был резервным.

Онлайн-синхронизация обычно означает, что все, что вы делаете в основном хранилище, немедленно реплицируется в систему резервного копирования, включая такие операции, как удаление (всех) снимков и/или томов злоумышленником или просто ошибка администратора.

решение2

30-дневный откат — это отличная возможность, но что делать, если «критически важный файл xyz» был поврежден/испорчен, и это было обнаружено только через 31+ день? Эта ситуация является разницей между резервным копированием и архивированием, но в вашем описании последнее не упоминается. Архивные системы обычно хранятся на очень дешевой ленте. Также нет информации о том, имеет ли бизнес нормативные или другие требования к хранению данных дольше 30 дней, что часто бывает.

Если в вашей ситуации это не так, то все должно быть хорошо.

решение3

Хорошо, когда данные есть на обеих географически разделенных машинах.

Что происходит, когда у вас происходит несколько сбоев, затрагивающих оба или все ваши сайты? Пожар на одном, кража серверов на другом? Или проблема с линией между ними, затем сервер основного местоположения выходит из строя, а контроллер HD сходит с ума и записывает мусор? Или какой-то инсайдер совершает вредоносные действия на обоих? Или ФБР конфискует ваши серверы в обоих местоположениях из-за подозрений (вы бы никогда этого не сделали, но, возможно, вы размещены в одном центре обработки данных с придурками). Или... Мне вспоминается несколько громких сбоев в «облаке», когда все было избыточным, проанализированным до энной степени, но, тем не менее, что-то может пойти не так. Я допускаю, что все это маловероятно, но вы признали, что маловероятные вещи могут произойти.

Итак, все сводится к тому, насколько важны/ценны эти данные? Что будет делать организация, если они пропадут?

решение4

Предположение: система хранения данных будет использоваться многими приложениями.

Я считаю, что вам будет гораздо лучше с отдельной системой резервного копирования.

RAID и зеркалирование не являются резервным копированием, но встроенная функция отката может заменить традиционную систему резервного копирования.

НО:

Я предпочитаю, чтобы политики восстановления были основаны на приложениях/данных, а не на хранилищах, потому что:

  1. приложения предъявляют различные требования, связанные с восстановлением и приемлемой потерей данных (некоторые из них налагаются различными правилами: носители только для чтения, шифрование, хранение последних X лет и т. д.),
  2. Некоторые приложения имеют (очень) хорошие встроенные инструменты резервного копирования и восстановления (Oracle, MSSQL) и рекомендуются для выполнения резервного копирования/восстановления (как администратор баз данных Oracle, я предпочитаю и буду делать все резервные копии, связанные с Oracle, с помощью rman).
  3. рост, использование вами пространства может расти гораздо быстрее, чем вы ожидаете, сейчас эта система может вмещать 30 дней отката данных, в будущем это не гарантируется
  4. дешевле, стоимость использования более крупных лент для реализации политик резервного копирования/восстановления после нескольких лет роста будет ниже, чем стоимость покупки новых, более крупных дисков для соблюдения того же окна отката, что и сейчас

Связанный контент