Почему мой скрипт оболочки bash меняет пробелы на переводы строк?

Question

Могу ли я внести некоторые изменения в ваш сценарий, чтобы упростить его и устранить вашу проблему?

Я вижу, что вы используете OpenSSL для вычисления хеша SHA1, а затем анализируете ненужный вывод и продолжаете сортировать и перебирать список хешей. Вы не указываете тег ОС в своем посте, но ваше использование /bin/bashпредполагает Linux, так почему бы не использовать sha1sumвместо этого? Это дает более простой вывод, который легче обрабатывать вашему скрипту. (Читатели, использующие BSD, могут использовать sha1 -rдля получения эквивалентного вывода.)

#!/bin/bash

find "$1" -type f -exec sha1sum \{\} \; > dupes.txt

awk '{print $1}' < dupes.txt |
  sort | uniq -c | sort -nr |
  while read COUNT HASH; do
    if [[ $COUNT == 1 ]]; then
      break
    else
      echo "--- duplicate set ---"
      grep "^$HASH " dupes.txt | sed -e "s/[^ ]* //"
      echo "---------------------"
    fi
  done

Можно провести и другие оптимизации, например, использовать findопции -print0и xargs, но, надеюсь, приведенные выше изменения помогут вам начать работу.

Answer 1

Могу ли я внести некоторые изменения в ваш сценарий, чтобы упростить его и устранить вашу проблему?

Я вижу, что вы используете OpenSSL для вычисления хеша SHA1, а затем анализируете ненужный вывод и продолжаете сортировать и перебирать список хешей. Вы не указываете тег ОС в своем посте, но ваше использование /bin/bashпредполагает Linux, так почему бы не использовать sha1sumвместо этого? Это дает более простой вывод, который легче обрабатывать вашему скрипту. (Читатели, использующие BSD, могут использовать sha1 -rдля получения эквивалентного вывода.)

#!/bin/bash

find "$1" -type f -exec sha1sum \{\} \; > dupes.txt

awk '{print $1}' < dupes.txt |
  sort | uniq -c | sort -nr |
  while read COUNT HASH; do
    if [[ $COUNT == 1 ]]; then
      break
    else
      echo "--- duplicate set ---"
      grep "^$HASH " dupes.txt | sed -e "s/[^ ]* //"
      echo "---------------------"
    fi
  done

Можно провести и другие оптимизации, например, использовать findопции -print0и xargs, но, надеюсь, приведенные выше изменения помогут вам начать работу.

Почему мой скрипт оболочки bash меняет пробелы на переводы строк?

решение1

Связанный контент