Recentemente decidi arquivar alguns dados usandoAlcatrão. Os dados consistem em vários backups da mesma pasta; o que significa que contém muitas duplicatas. Eu li isso porque o Tar não possui um índice, ele não funciona bem com dados que contêm muitas duplicatas. Então, basicamente, minha pergunta é: o Tar seria adequado para arquivar esses dados?
Eu me preocupo principalmente em preservar todos os dados originais em um arquivo, isso inclui todos os carimbos de data/hora do arquivo: criação, modificação, acesso.
Responder1
É claro que o Tar pode arquivar esses backups, não importa quantas duplicatas você tenha. Se você tiver 100 duplicatas do arquivo abc.doc em 100 pastas diferentes, ele será arquivado 100 vezes. Dito isto, não é eficiente.
Se uma ferramenta de backup pudesse desduplicar dados, ela reconheceria esses 100 arquivos idênticos, faria backup de um e faria referência a ele 99 vezes. Se uma dessas versões for alterada, a referência será removida e o backup será feito separadamente.
Responder2
Alcatrão GNU
Tempo de criação:
O Linux realmente não registra o tempo de criação de arquivos. Ele tem o ctime
carimbo de data/hora, que às vezes é confundido com o horário de criação, mas na verdade é "horário de mudança do inode": ele registra a última vez que houve uma alteração no arquivo ou em suas permissões, proprietário, etc. ele muda com mais frequência do que mtime
. O ctime
carimbo é manipulado pelo kernel e não pode ser definido para valores arbitrários pelo usuário (embora você possa redefini-lo para a hora atual com bastante facilidade).
Tempo de modificação:
mtime
é preservado portar
Tempo de acesso:
tar
normalmente altera o tempo de acesso mesmo no arquivo original. Você pode evitar isso usando o --atime-preserve
sinalizador. Você também pode querer a --preserve
tag que preserva as permissões (e também a ordem de classificação do diretório).
Não sei se você pode tar
preservar atimes nos arquivos arquivados, mas você sempre pode corrigi-los:
- Destravar
- Usando
touch -a -d TIME FILE
em cada arquivo (com a hora no formato[[CC]YY]MMDDhhmm[.ss]
) - Re-alcatrão com
tar --atime-preserve
aviso: Usar --atime-preserve
atualmente lembra o horário para que possa preservá-lo após lê-lo. Na maioria dos sistemas, isso fará com que o ctime mude, o que às vezes pode interferir em outros softwares (por exemplo, software de segurança).
Outros softwares
Você pode pesquisar rsync
(vejaEste artigopor exemplo) ou um sistema de controle de versão (como git
)