Diferenciando dois diretórios recursivamente com base em somas de verificação?

Question

Eu geraria uma listagem md5sum (uma coluna para soma e uma coluna para nome de arquivo) para ambas as árvores e canalizaria o resultado em um script (digamos awk ou perl) que pode usar a soma como um hash para os nomes de arquivos e fazer o nomes de arquivos de relatório de script que possuem o mesmo valor de hash.

Isso é mais do que uma frase simples e é algo frequentemente questionado e frequentemente resolvido (uma pesquisa na web por arquivos duplicados por conteúdo resulta em mais de um milhão de resultados).

Você pode achar isso útil:

Encontrando arquivos duplicados?

Answer 1

Eu geraria uma listagem md5sum (uma coluna para soma e uma coluna para nome de arquivo) para ambas as árvores e canalizaria o resultado em um script (digamos awk ou perl) que pode usar a soma como um hash para os nomes de arquivos e fazer o nomes de arquivos de relatório de script que possuem o mesmo valor de hash.

Isso é mais do que uma frase simples e é algo frequentemente questionado e frequentemente resolvido (uma pesquisa na web por arquivos duplicados por conteúdo resulta em mais de um milhão de resultados).

Você pode achar isso útil:

Encontrando arquivos duplicados?

Diferenciando dois diretórios recursivamente com base em somas de verificação?

Caso de teste

Responder1

informação relacionada