Der beste Weg, Text vom Anfang einer großen Datei zu entfernen

Question 1

bunzip2 -c backup.sql.bz2 | \
  sed -n '/-- Table structure for `mytable`/,$p'

Erläuterung:

-n suppress automatic printing of pattern space

Adressbereichsaufbau: Beginnen Sie mit regulären Ausdrücken

/-- Table structure for  `mytable`/

Ende mit

$ Match the last line.

Befehl

p Print the current pattern space.

Bearbeiten: Abhängig davon, wie Sie die Datenbank gesichert haben, haben Sie möglicherweisesehrlange Zeilen. GNU sed kann sie im Rahmen der verfügbaren Speichermenge verarbeiten.

Answer

bunzip2 -c backup.sql.bz2 | \
  sed -n '/-- Table structure for `mytable`/,$p'

Erläuterung:

-n suppress automatic printing of pattern space

Adressbereichsaufbau: Beginnen Sie mit regulären Ausdrücken

/-- Table structure for  `mytable`/

Ende mit

$ Match the last line.

Befehl

p Print the current pattern space.

Bearbeiten: Abhängig davon, wie Sie die Datenbank gesichert haben, haben Sie möglicherweisesehrlange Zeilen. GNU sed kann sie im Rahmen der verfügbaren Speichermenge verarbeiten.

Question 2

HINWEIS: Keine tatsächliche Antwort

Da ich motiviert war, dieses Problem zu lösenJetzt, ich habe es versucht und verwendet, grepum den Offset in der gewünschten Datei zu finden. Es hat wunderbar funktioniert.

Zum Ausführen ddist leider ein Set erforderlich, ibs=1was im Grunde bedeutet, dass kein Puffer vorhanden ist und die Leistung schrecklich ist. Während ich darauf wartete, dass dd fertig wird, habe ich Zeit damit verbracht, mein eigenes benutzerdefiniertes C-Programm zu schreiben, um die Bytes zu überspringen. Nachdem ich das getan hatte, sah ich, dass tailes genauso einfach für mich hätte erledigt werden können:

$ bunzip2 -c restore.sql.bz2 | tail -c +[offset] | bzip2 -c > restore-trimmed.sql.bz2

Ich sage „das beantwortet meine Frage nicht“, weil trotzdem zwei Durchgänge durch die Datei erforderlich sind: einer, um den Offset des gesuchten Objekts zu finden, und ein weiterer, um die Datei zuzuschneiden.

Wenn ich zu meinem benutzerdefinierten Programm zurückkehren würde, könnte ich Folgendes implementieren:KMPwährend der „Nur-Lesen“-Phase des Programms und wechseln Sie danach zu „Alles lesen+schreiben“.

Answer

HINWEIS: Keine tatsächliche Antwort

Da ich motiviert war, dieses Problem zu lösenJetzt, ich habe es versucht und verwendet, grepum den Offset in der gewünschten Datei zu finden. Es hat wunderbar funktioniert.

Zum Ausführen ddist leider ein Set erforderlich, ibs=1was im Grunde bedeutet, dass kein Puffer vorhanden ist und die Leistung schrecklich ist. Während ich darauf wartete, dass dd fertig wird, habe ich Zeit damit verbracht, mein eigenes benutzerdefiniertes C-Programm zu schreiben, um die Bytes zu überspringen. Nachdem ich das getan hatte, sah ich, dass tailes genauso einfach für mich hätte erledigt werden können:

$ bunzip2 -c restore.sql.bz2 | tail -c +[offset] | bzip2 -c > restore-trimmed.sql.bz2

Ich sage „das beantwortet meine Frage nicht“, weil trotzdem zwei Durchgänge durch die Datei erforderlich sind: einer, um den Offset des gesuchten Objekts zu finden, und ein weiterer, um die Datei zuzuschneiden.

Wenn ich zu meinem benutzerdefinierten Programm zurückkehren würde, könnte ich Folgendes implementieren:KMPwährend der „Nur-Lesen“-Phase des Programms und wechseln Sie danach zu „Alles lesen+schreiben“.

Question 3

Ich frage mich, ob so etwas funktionieren würde:

use strict;
use warnings;
use feature 'say';

use IO::Uncompress::Bunzip2 '$Bunzip2Error';

my $file = $ARGV[0] // die "need a file";

my $zh = IO::Uncompress::Bunzip2->new( $file, {
    AutoClose   => 1,
    Transparent => 1,
} ) or die "IO::Uncompress::Bunzip2 failed: $Bunzip2Error\n";

my $trigger = undef;
while ( <$zh> ) {
    chomp;
    $trigger = 1 if $_ eq '-- Dumping data for table `experiments`';
    say if $trigger;
}

Es beginnt also grundsätzlich mit dem Drucken des Materials gemäß dem Muster. Man kann es auch direkt an bzip2/gzip weiterleiten, wie es unter Debian perl chop.pl input_sql.bz2 | bzip2 > out.sql.bz2 erforderlich wäre .libio-compress-perl

Answer

Ich frage mich, ob so etwas funktionieren würde:

use strict;
use warnings;
use feature 'say';

use IO::Uncompress::Bunzip2 '$Bunzip2Error';

my $file = $ARGV[0] // die "need a file";

my $zh = IO::Uncompress::Bunzip2->new( $file, {
    AutoClose   => 1,
    Transparent => 1,
} ) or die "IO::Uncompress::Bunzip2 failed: $Bunzip2Error\n";

my $trigger = undef;
while ( <$zh> ) {
    chomp;
    $trigger = 1 if $_ eq '-- Dumping data for table `experiments`';
    say if $trigger;
}

Es beginnt also grundsätzlich mit dem Drucken des Materials gemäß dem Muster. Man kann es auch direkt an bzip2/gzip weiterleiten, wie es unter Debian perl chop.pl input_sql.bz2 | bzip2 > out.sql.bz2 erforderlich wäre .libio-compress-perl

Der beste Weg, Text vom Anfang einer großen Datei zu entfernen

Antwort1

Antwort2

Antwort3

verwandte Informationen