¿Extraer (y volcar a la salida estándar) solo un cierto rango de filas de un CSV?

Question 1

El comando csvfix findadmite el volcado de una fila por rango o número. El siguiente comando extraería las líneas 3 y 4 de un archivo llamado file.csv.

csvfix find -if '$line >= 3 && $line < 5' file.csv

Answer

El comando csvfix findadmite el volcado de una fila por rango o número. El siguiente comando extraería las líneas 3 y 4 de un archivo llamado file.csv.

csvfix find -if '$line >= 3 && $line < 5' file.csv

Question 2

Puede eliminar temporalmente todas las nuevas líneas entre comillas para poder utilizar las herramientas de texto normales y volver a agregar las nuevas líneas.

Por ejemplo, en caso de comillas dobles:

gawk -v RS='"' 'NR % 2 == 0 { gsub(/\n/, "%NEWLINE%") } { printf("%s%s", $0, RT) }' file.csv > tmp.csv
head -n 700 tmp.csv | sed 's/%NEWLINE%/\n/g' > file_1-700.csv

Answer

Puede eliminar temporalmente todas las nuevas líneas entre comillas para poder utilizar las herramientas de texto normales y volver a agregar las nuevas líneas.

Por ejemplo, en caso de comillas dobles:

gawk -v RS='"' 'NR % 2 == 0 { gsub(/\n/, "%NEWLINE%") } { printf("%s%s", $0, RT) }' file.csv > tmp.csv
head -n 700 tmp.csv | sed 's/%NEWLINE%/\n/g' > file_1-700.csv

Question 3

Puede obtener una posición del Text::CSV_XS de Perl de esta manera:

perl -MText::CSV_XS -E 'open(my $fh, "<:encoding(utf8)", $ARGV[0]) or die "open: $!"; $csv = Text::CSV_XS->new({binary => 1, auto_diag => 9, diag_verbose => 1 } ); while (my $row = $csv->getline($fh)) { say tell $fh }' FILENAME.csv

Tenga en cuenta el FILENAME.csval final de la línea.

Después de analizar con éxito cada fila, imprimirá elbytecompensar.

Desembalaje del resumen:

use Text::CSV_XS;
use feature 'say';
open(my $fh, '<:encoding(utf8)', $ARGV[0]) or die "open: $!";
$csv = 'Text::CSV_XS'->new({'binary' => 1, 'auto_diag' => 9, 'diag_verbose' => 1});
while (my $row = $csv->getline($fh)) {
    say tell $fh
}

Le alimenté este CSS defectuoso ( new.css):

r1c1,"r1
c2",r1c3
r2c1,"r2c2,r2c3
r3c1,r3c2,r3c3

Producción:

18
# CSV_XS ERROR: 2027 - EIQ - Quoted field not terminated @ rec 1 pos 15 field 2

(Si hubiera más filas buenas antes de la corrupta, se imprimirían más compensaciones de bytes. Utilice la última).

Entonces, después del byte 18, encontró un error. Es bastante fácil obtener un número de línea a partir de eso: head -c 18 new.csv | wc -l, que dice 2 (el número de líneas buenas). Entonces el error está en la línea 3, y de hecho lo está, la cita alrededor de r2c2 no está cerrada.

Answer

Puede obtener una posición del Text::CSV_XS de Perl de esta manera:

perl -MText::CSV_XS -E 'open(my $fh, "<:encoding(utf8)", $ARGV[0]) or die "open: $!"; $csv = Text::CSV_XS->new({binary => 1, auto_diag => 9, diag_verbose => 1 } ); while (my $row = $csv->getline($fh)) { say tell $fh }' FILENAME.csv

Tenga en cuenta el FILENAME.csval final de la línea.

Después de analizar con éxito cada fila, imprimirá elbytecompensar.

Desembalaje del resumen:

use Text::CSV_XS;
use feature 'say';
open(my $fh, '<:encoding(utf8)', $ARGV[0]) or die "open: $!";
$csv = 'Text::CSV_XS'->new({'binary' => 1, 'auto_diag' => 9, 'diag_verbose' => 1});
while (my $row = $csv->getline($fh)) {
    say tell $fh
}

Le alimenté este CSS defectuoso ( new.css):

r1c1,"r1
c2",r1c3
r2c1,"r2c2,r2c3
r3c1,r3c2,r3c3

Producción:

18
# CSV_XS ERROR: 2027 - EIQ - Quoted field not terminated @ rec 1 pos 15 field 2

(Si hubiera más filas buenas antes de la corrupta, se imprimirían más compensaciones de bytes. Utilice la última).

Entonces, después del byte 18, encontró un error. Es bastante fácil obtener un número de línea a partir de eso: head -c 18 new.csv | wc -l, que dice 2 (el número de líneas buenas). Entonces el error está en la línea 3, y de hecho lo está, la cita alrededor de r2c2 no está cerrada.

¿Extraer (y volcar a la salida estándar) solo un cierto rango de filas de un CSV?

Respuesta1

Respuesta2

Respuesta3

información relacionada