Por que meu script de shell bash está alterando espaços para feeds de linha?

Question

Posso fazer algumas modificações no seu script para simplificá-lo e também eliminar o seu problema?

Vejo que você está usando OpenSSL para calcular o hash SHA1 e, em seguida, analisando algumas saídas desnecessárias e classificando e iterando a lista de hashes. Você não especifica uma tag de sistema operacional em sua postagem, mas o uso de /bin/bashsugere Linux, então por que não usar sha1sum? Ele produz uma saída mais simples que é mais fácil de processar pelo seu script. (Leitores que usam BSD podem usar sha1 -rpara obter resultados equivalentes.)

#!/bin/bash

find "$1" -type f -exec sha1sum \{\} \; > dupes.txt

awk '{print $1}' < dupes.txt |
  sort | uniq -c | sort -nr |
  while read COUNT HASH; do
    if [[ $COUNT == 1 ]]; then
      break
    else
      echo "--- duplicate set ---"
      grep "^$HASH " dupes.txt | sed -e "s/[^ ]* //"
      echo "---------------------"
    fi
  done

Existem outras otimizações que podem ser feitas, como usar finda opção ' -print0e xargs, mas esperamos que as revisões acima ajudem você a começar.

Answer 1

Posso fazer algumas modificações no seu script para simplificá-lo e também eliminar o seu problema?

Vejo que você está usando OpenSSL para calcular o hash SHA1 e, em seguida, analisando algumas saídas desnecessárias e classificando e iterando a lista de hashes. Você não especifica uma tag de sistema operacional em sua postagem, mas o uso de /bin/bashsugere Linux, então por que não usar sha1sum? Ele produz uma saída mais simples que é mais fácil de processar pelo seu script. (Leitores que usam BSD podem usar sha1 -rpara obter resultados equivalentes.)

#!/bin/bash

find "$1" -type f -exec sha1sum \{\} \; > dupes.txt

awk '{print $1}' < dupes.txt |
  sort | uniq -c | sort -nr |
  while read COUNT HASH; do
    if [[ $COUNT == 1 ]]; then
      break
    else
      echo "--- duplicate set ---"
      grep "^$HASH " dupes.txt | sed -e "s/[^ ]* //"
      echo "---------------------"
    fi
  done

Existem outras otimizações que podem ser feitas, como usar finda opção ' -print0e xargs, mas esperamos que as revisões acima ajudem você a começar.

Por que meu script de shell bash está alterando espaços para feeds de linha?

Responder1

informação relacionada