vários utilitários de somas de verificação precedem o hash com barra invertida

vários utilitários de somas de verificação precedem o hash com barra invertida

O que está acontecendo aqui? Uma barra invertida em um nome de diretório e/ou nome de arquivo parece fazer com que vários utilitários de soma de verificação relatem o hash precedido por uma barra invertida.

Observe que o coreutil wcnão se comporta dessa maneira.

Comportamento conforme esperado:

#ppd# ls -1a
.
..
#ppd# mkdir a\\b
#ppd# ls -1
a\b
#ppd# for i in 1 2 3; do echo $i > a\\b/c$i; done

#ppd# ls -1 a\\b/c*
a\b/c1
a\b/c2
a\b/c3

#ppd# cat a\\b/c*
1
2
3

#ppd# wc --version
wc (GNU coreutils) 8.13
#pre# wc a\\b/c*
1 1 2 a\b/c1
1 1 2 a\b/c2
1 1 2 a\b/c3

#ppd# cd a\\b/

#ppd# md5sum --version
md5sum (GNU coreutils) 8.13

#ppd# md5sum c*
b026324c6904b2a9cb4b88d6d61c81d1  c1
26ab0db90d72e28ad0ba1e22ee510510  c2
6d7fce9fee471194aa8b5b6e47267f03  c3

Agora, para o comportamento estranho:

#ppd# pwd
/home/abe/tdir/a\b

#ppd# md5sum ../a\\b/c*
\b026324c6904b2a9cb4b88d6d61c81d1  ../a\\b/c1
\26ab0db90d72e28ad0ba1e22ee510510  ../a\\b/c2
\6d7fce9fee471194aa8b5b6e47267f03  ../a\\b/c3

#ppd# cd ..

#ppd# md5sum a\\b/c*
\b026324c6904b2a9cb4b88d6d61c81d1  a\\b/c1
\26ab0db90d72e28ad0ba1e22ee510510  a\\b/c2
\6d7fce9fee471194aa8b5b6e47267f03  a\\b/c3

#ppd# sha1sum a\\b/c*
\e5fa44f2b31c1fb553b6021e7360d07d5d91ff5e  a\\b/c1
\7448d8798a4380162d4b56f9b452e2f6f9e24e7a  a\\b/c2
\a3db5c13ff90a36963278c6a39e4ee3c22e2a436  a\\b/c3

#ppd# sha256sum a\\b/c*
\4355a46b19d348dc2f57c046f8ef63d4538ebb936000f3c9ee954a27460dd865  a\\b/c1
\53c234e5e8472b6ac51c1ae1cab3fe06fad053beb8ebfd8977b010655bfdd3c3  a\\b/c2
\1121cfccd5913f0a63fec40a6ffd44ea64f9dc135c66634ba001d10bcf4302a2  a\\b/c3

Barra invertida no nome do arquivo:

#ppd# echo "4" > a\\b/c\\4
#ppd# ls -1 a\\b/*
a\b/c1
a\b/c2
a\b/c3
a\b/c\4

#ppd# md5sum a\\b/*
\b026324c6904b2a9cb4b88d6d61c81d1  a\\b/c1
\26ab0db90d72e28ad0ba1e22ee510510  a\\b/c2
\6d7fce9fee471194aa8b5b6e47267f03  a\\b/c3
\48a24b70a0b376535542b996af517398  a\\b/c\\4

#ppd# cd a\\b/
#ppd# md5sum *
b026324c6904b2a9cb4b88d6d61c81d1  c1
26ab0db90d72e28ad0ba1e22ee510510  c2
6d7fce9fee471194aa8b5b6e47267f03  c3
\48a24b70a0b376535542b996af517398  c\\4

Eu descobri o que foi dito acima ao armazenar os hashes no xattrs como ss=md5sum <filename>; setfattr -n user.cksm -v ${ss:0:32}. Aqui estão alguns dos caracteres relatados por getfattr -n user.cksm.md5(a primeira linha é apenas para ajudar na contagem dos caracteres, que devem ser 32 para um hash md5:

#              123456789 123456789 123456789 12
user.cksm.md5="be28d5286d9c719a904550f41593d"
user.cksm.md5="a4e9e6958c9d5762dcf090871e44bf"
user.cksm.md5="#f39b8c4dc110178505c089cba7986"
user.cksm.md5="\\ebf1b8f8054d21c78f2a699776f84a0"
user.cksm.md5="+c2769ebdd2ce3a8355395d2129051"
user.cksm.md5="/9ac5b68efea0e9f02c917503cbb3e"

Responder1

(Retirada da auto-resposta da questão)

De acordo comesta respostaparaoutra pergunta, a resposta para a presente questão é rtfm:

NOTA: A documentação do resumo do GNU sha faz referência à documentação do resumo do md5sum

Para cada arquivo, 'md5sum' gera por padrão a soma de verificação MD5, um espaço, um sinalizador indicando o modo de entrada binário ou de texto e o nome do arquivo. O modo binário é indicado com '*', o modo texto com ' ' (espaço). O modo binário é o padrão em sistemas onde é significativo, caso contrário, o modo de texto é o padrão. Se arquivocontém uma barra invertidaou nova linha, a linha é iniciada com uma barra invertida e cada caractere problemático no nome do arquivo é escapado com uma barra invertida, tornando a saída inequívoca mesmo na presença de nomes de arquivo arbitrários. Se o arquivo for omitido ou especificado como '-', a entrada padrão será lida.

informação relacionada