удалить столбец массива с разной длиной

Question 1

Я уверен, что есть множество разных способов сделать это. Я предпочитаю sed:

sed 's/"{.*}",//'

НаGNU/Linux(GNU sed), используйте:

sed 's/"{.*}",//' csv
001,"Geography",TRUE,1,"CHARLIE"
002,"History",FALSE,0,"DAVID"
003,"Mathematics",TRUE,1,"SAM"

ОС X(BSD sed, обратите внимание на -Eфлаг):

sed -E 's/"{.*}",//' csv 
001,"Geography",TRUE,1,"CHARLIE"
002,"History",FALSE,0,"DAVID"
003,"Mathematics",TRUE,1,"SAM"

Answer

Я уверен, что есть множество разных способов сделать это. Я предпочитаю sed:

sed 's/"{.*}",//'

НаGNU/Linux(GNU sed), используйте:

sed 's/"{.*}",//' csv
001,"Geography",TRUE,1,"CHARLIE"
002,"History",FALSE,0,"DAVID"
003,"Mathematics",TRUE,1,"SAM"

ОС X(BSD sed, обратите внимание на -Eфлаг):

sed -E 's/"{.*}",//' csv 
001,"Geography",TRUE,1,"CHARLIE"
002,"History",FALSE,0,"DAVID"
003,"Mathematics",TRUE,1,"SAM"

Question 2

Используйте Python и его модуль CSV, например, следующую отдельную команду:

python -c 'import sys,csv
w = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for row in csv.reader(sys.stdin):
    del row[3]
    w.writerow(row)' < file.csv > file_edited.csv

Магия происходит в предпоследней строке команды. В Python массивы начинаются с индекса 0, как row[3]и четвертый столбец; так что этот просто удаляет четвертый столбец в каждой записи.

В качестве альтернативы вы можете просто напечатать столбцы 0, 1, 2, 4 и 5, используя

python -c 'import sys,csv
w = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for row in csv.reader(sys.stdin):
    w.writerow([row[0], row[1], row[2], row[4], row[5]])' < file.csv > file_edited.csv

Answer

Используйте Python и его модуль CSV, например, следующую отдельную команду:

python -c 'import sys,csv
w = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for row in csv.reader(sys.stdin):
    del row[3]
    w.writerow(row)' < file.csv > file_edited.csv

Магия происходит в предпоследней строке команды. В Python массивы начинаются с индекса 0, как row[3]и четвертый столбец; так что этот просто удаляет четвертый столбец в каждой записи.

В качестве альтернативы вы можете просто напечатать столбцы 0, 1, 2, 4 и 5, используя

python -c 'import sys,csv
w = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for row in csv.reader(sys.stdin):
    w.writerow([row[0], row[1], row[2], row[4], row[5]])' < file.csv > file_edited.csv

удалить столбец массива с разной длиной

решение1

решение2

Связанный контент