sed: Löschen einer Pfadliste aus einem Satz von Dateien

sed: Löschen einer Pfadliste aus einem Satz von Dateien

Ich habe eine Datei namensgemeinsam.txtdas eine Liste absoluter Pfade enthält. Beispiel:

/etc
/etc/group
/var/log/syslog

Ich habe auch eine Reihe von Dateien<Hostname>.txtdie auch eine Liste absoluter Pfade enthalten. Hier ist ein Beispiel (nennen wir eshost1.txt):

/root/.bashrc
/var/log/syslog
/etc/hosts
/bin/true
/etc
/sbin/rtmon
/etc/group

Ich möchte jeden Pfad entfernen, der erscheint ingemeinsam.txtaus jeder Datei im Dateisatz<Dateiname>.txtDie Beispieldateihost1.txtoben würde lauten:

/root/.bashrc
/etc/hosts
/bin/true
/sbin/rtmon

Dazu habe ich folgendes Bash-Skript geschrieben:

#!/bin/bash

set -o nounset
set -o errexit
set -o pipefail

while read -r ONE_PATH
do
   for ONE_FILE in host1.txt host2.txt host3.txt
   do
      sed -i '\:'"$ONE_PATH"':d' "$ONE_FILE"
   done
done < common.txt

Ich habe Schwierigkeiten, den sed-Befehl richtig auszuführen. Was oben angezeigt wird, führt dazu, dass alle bearbeiteten Dateien leer werden.

Wie kann ich das beheben, um mein Ziel zu erreichen?

Antwort1

#!/bin/bash

set -o nounset
set -o errexit
set -o pipefail

declare -r SCRIPT_DIR="$( cd "$( dirname "${BASH_SOURCE[0]}" )" && pwd )"
declare -r FILES_DIR=${SCRIPT_DIR%/*}

while read -r ONE_PATH
do
   for ONE_FILE in $(find "$FILES_DIR" -maxdepth 1 -type f -print)
   do
      if [[ "$ONE_FILE" == *".swp" ]] ||
         [[ "$ONE_FILE" == *"common.txt" ]]; then
         continue
      fi

      sed -i '\|^'"$ONE_PATH"'$|d' "$ONE_FILE"
   done

echo "Done removing $ONE_PATH"
done < "$SCRIPT_DIR"/../common.txt

exit 0

Antwort2

Darf ich eine Lösung vorschlagen, die sed nicht verwendet?

sort common.txt > common.txt.sorted
for f in host1.txt host2.txt host3.txt ; do
    sort $f > $f.sorted
    diff common.txt.sorted $f.sorted | egrep '^>' | sed -e 's/^> //' > $f.output
    rm $f.sorted
done

Sortierensortiert Listen in alphabetischer Reihenfolge. Unterschiedfindet die Unterschiede zwischen einer Datei undgemeinsam.txt.egrepwählt Zeilen aus, die mit beginnen >, also Zeilen inhost1.txt.sortiertaber nicht inallgemein.txt.sortiert. Endlich,sedentfernt den führenden >(auf den ein Leerzeichen folgt)Unterschied.

Die Ausgabeliste erfolgt ebenfalls in alphabetischer Reihenfolge.

Antwort3

Zuerst sollte die Eingabe rückwärts sortiert werden. Es hat keinen Sinn, /etc zu entfernen und dann nach /etc/group zu suchen. Dann überprüfen wir, ob die Datei geschrieben werden kann (wenn nicht, überspringen). Dann sollte ONE_PATH maskiert werden und dann kann sed seine Arbeit machen.

sort -r common.txt \
| while read -r ONE_PATH
do
   for ONE_FILE in host1.txt host2.txt host3.txt
   do
      if [ -w "$ONE_FILE" ]
      then
        # sed -i '\:'"$ONE_PATH"':d' "$ONE_FILE"
        ONE_PATH_ESC=$(echo "$ONE_PATH" | sed "s!/!\\\/!g")
        sed -i 's/^'"$ONE_PATH_ESC"'//' "$ONE_FILE"
      fi
   done
done

Mit den bereitgestellten Testdaten erhalten Sie:

$ pr -n host1.txt
1   /root/.bashrc
2
3   /hosts
4   /bin/true
5
6   /sbin/rtmon
7

Es gibt 3 leere Zeilen.

verwandte Informationen