Atualmente estou usando o rsnapshot para implementar um esquema de backup diário/semanal/mensal em um disco externo. Ultimamente tenho lido muito sobre sistemas de arquivos copy-on-write como zfs e btrfs. Gosto bastante da capacidade de armazenar instantâneos para voltar no tempo.
Existe alguma desvantagem séria na abordagem a seguir para criar um histórico de backups diários?
- Todos os dias eu sincronizava meus dados com a unidade externa, formatada com zfs ou btrfs, usando rsync.
- Depois disso, eu criaria um instantâneo.
- Provavelmente implemente alguma redução na cadeia de backup.
Responder1
É um esquema funcional, mas para ficar ainda mais confortável, você pode armazenar dados no zfs. Isto dará as seguintes vantagens:
- você será capaz de criar instantâneos exatamente no local onde precisa deles - isso elimina a necessidade de transportar dados de volta durante o procedimento de recuperação
- você será capaz de fazer backup para um segundo host usando instantâneos incrementais, e isso, por sua vez, significa que a) isso é mais rápido b) diferentemente dos pacotes de arquivos incrementais, o instantâneo incremental adicionará dados à parte existente, em vez de apenas colocar no disco inteiro e aguardando para serem extraídos em sequência para receber a cópia completa c) você terá automaticamente dois conjuntos de instantâneos - um no host principal e outro no segundo
- você não precisará contabilizar o tempo necessário para o rsync sincronizar recursos para que a criação do instantâneo comece após o término do rsync, para obter um estado consistente do instantâneo (muitas vezes isso pode não ser tão vital, mas de qualquer maneira, um motivo a menos para se preocupar).
Responder2
Dê uma olhada embtrbk. Basicamente, o que o autor da postagem anterior escreveu também pode ser feito com o btrfs. Btrbk irá automatizar isso para você. A diferença de velocidade entre o rsnapshot baseado em rsync e o btrbk baseado em envio/recebimento de btrfs é muito convincente. Por ser tão fácil, tenho um cron job que agora faz backups de hora em hora.