Entfernen einer Array-Spalte mit unterschiedlicher Länge

Question 1

Ich bin sicher, dass es unzählige verschiedene Möglichkeiten gibt, dies zu erreichen. Ich bevorzuge sed:

sed 's/"{.*}",//'

AnGNU/Linux(GNU sed), Verwendung:

sed 's/"{.*}",//' csv
001,"Geography",TRUE,1,"CHARLIE"
002,"History",FALSE,0,"DAVID"
003,"Mathematics",TRUE,1,"SAM"

OS X(BSD sed, beachten Sie das -EFlag):

sed -E 's/"{.*}",//' csv 
001,"Geography",TRUE,1,"CHARLIE"
002,"History",FALSE,0,"DAVID"
003,"Mathematics",TRUE,1,"SAM"

Answer

Ich bin sicher, dass es unzählige verschiedene Möglichkeiten gibt, dies zu erreichen. Ich bevorzuge sed:

sed 's/"{.*}",//'

AnGNU/Linux(GNU sed), Verwendung:

sed 's/"{.*}",//' csv
001,"Geography",TRUE,1,"CHARLIE"
002,"History",FALSE,0,"DAVID"
003,"Mathematics",TRUE,1,"SAM"

OS X(BSD sed, beachten Sie das -EFlag):

sed -E 's/"{.*}",//' csv 
001,"Geography",TRUE,1,"CHARLIE"
002,"History",FALSE,0,"DAVID"
003,"Mathematics",TRUE,1,"SAM"

Question 2

Verwenden Sie Python und sein CSV-Modul, beispielsweise den folgenden einzelnen Befehl:

python -c 'import sys,csv
w = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for row in csv.reader(sys.stdin):
    del row[3]
    w.writerow(row)' < file.csv > file_edited.csv

Die Magie geschieht in der vorletzten Zeile des Befehls. In Python beginnen Arrays bei Index 0, ebenso wie row[3]die vierte Spalte. Daher wird hier einfach die vierte Spalte aus jedem Datensatz entfernt.

Alternativ können Sie einfach die Spalten 0, 1, 2, 4 und 5 ausdrucken, indem Sie

python -c 'import sys,csv
w = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for row in csv.reader(sys.stdin):
    w.writerow([row[0], row[1], row[2], row[4], row[5]])' < file.csv > file_edited.csv

Answer

Verwenden Sie Python und sein CSV-Modul, beispielsweise den folgenden einzelnen Befehl:

python -c 'import sys,csv
w = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for row in csv.reader(sys.stdin):
    del row[3]
    w.writerow(row)' < file.csv > file_edited.csv

Die Magie geschieht in der vorletzten Zeile des Befehls. In Python beginnen Arrays bei Index 0, ebenso wie row[3]die vierte Spalte. Daher wird hier einfach die vierte Spalte aus jedem Datensatz entfernt.

Alternativ können Sie einfach die Spalten 0, 1, 2, 4 und 5 ausdrucken, indem Sie

python -c 'import sys,csv
w = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for row in csv.reader(sys.stdin):
    w.writerow([row[0], row[1], row[2], row[4], row[5]])' < file.csv > file_edited.csv

Entfernen einer Array-Spalte mit unterschiedlicher Länge

Antwort1

Antwort2

verwandte Informationen