Warum ändert mein Bash-Shell-Skript Leerzeichen in Zeilenumbrüche?

Question

Darf ich einige Änderungen an Ihrem Skript vornehmen, um es zu vereinfachen und auch Ihr Problem zu beheben?

Ich sehe, Sie verwenden OpenSSL, um den SHA1-Hash zu berechnen, analysieren dann einige unnötige Ausgaben und fahren mit dem Sortieren und Durchlaufen der Hashliste fort. Sie geben in Ihrem Beitrag kein OS-Tag an, aber Ihre Verwendung von /bin/bashdeutet auf Linux hin. Warum also nicht stattdessen verwenden sha1sum? Dadurch wird eine einfachere Ausgabe erzeugt, die für Ihr Skript leichter zu verarbeiten ist. (Leser, die BSD verwenden, können verwenden, sha1 -rum eine gleichwertige Ausgabe zu erhalten.)

#!/bin/bash

find "$1" -type f -exec sha1sum \{\} \; > dupes.txt

awk '{print $1}' < dupes.txt |
  sort | uniq -c | sort -nr |
  while read COUNT HASH; do
    if [[ $COUNT == 1 ]]; then
      break
    else
      echo "--- duplicate set ---"
      grep "^$HASH " dupes.txt | sed -e "s/[^ ]* //"
      echo "---------------------"
    fi
  done

Es könnten noch weitere Optimierungen vorgenommen werden, wie etwa die Verwendung findder Option von -print0und xargs, aber hoffentlich helfen Ihnen die oben aufgeführten Überarbeitungen beim Einstieg.

Answer 1

Darf ich einige Änderungen an Ihrem Skript vornehmen, um es zu vereinfachen und auch Ihr Problem zu beheben?

Ich sehe, Sie verwenden OpenSSL, um den SHA1-Hash zu berechnen, analysieren dann einige unnötige Ausgaben und fahren mit dem Sortieren und Durchlaufen der Hashliste fort. Sie geben in Ihrem Beitrag kein OS-Tag an, aber Ihre Verwendung von /bin/bashdeutet auf Linux hin. Warum also nicht stattdessen verwenden sha1sum? Dadurch wird eine einfachere Ausgabe erzeugt, die für Ihr Skript leichter zu verarbeiten ist. (Leser, die BSD verwenden, können verwenden, sha1 -rum eine gleichwertige Ausgabe zu erhalten.)

#!/bin/bash

find "$1" -type f -exec sha1sum \{\} \; > dupes.txt

awk '{print $1}' < dupes.txt |
  sort | uniq -c | sort -nr |
  while read COUNT HASH; do
    if [[ $COUNT == 1 ]]; then
      break
    else
      echo "--- duplicate set ---"
      grep "^$HASH " dupes.txt | sed -e "s/[^ ]* //"
      echo "---------------------"
    fi
  done

Es könnten noch weitere Optimierungen vorgenommen werden, wie etwa die Verwendung findder Option von -print0und xargs, aber hoffentlich helfen Ihnen die oben aufgeführten Überarbeitungen beim Einstieg.

Warum ändert mein Bash-Shell-Skript Leerzeichen in Zeilenumbrüche?

Antwort1

verwandte Informationen