Ich habe also diesen Wikipedia-Dump mit einer Größe von etwa 10 GB und dem Namen „enwiki-latest-pages-articles.xml.bz2“. Ich habe die folgenden Befehle im Terminal ausprobiert, um den Dump zu entpacken:
tar jxf enwiki-latest-pages-articles.xml.bz2
Und
tar xvf enwiki-latest-pages-articles.xml.bz2
Aber beide geben den folgenden Fehler zurück
tar: This does not look like a tar archive
tar: Skipping to next header
Antwort1
Sie können den Befehl nicht verwenden tar
, da das Archiv keine .tar.*-Datei ist. Um eine bzip2-Datei zu dekomprimieren, verwenden Sie den folgenden Befehl (dabei bleibt die ursprüngliche .bz2-Datei nicht erhalten):
bzip2 -d enwiki-latest-pages-articles.xml.bz2
Wenn Sie es extrahieren und das Original behalten möchten, führen Sie diesen Befehl aus:
bzip2 -dk enwiki-latest-pages-articles.xml.bz2
Quelle:https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
Antwort2
Benutz einfach bunzip2
:
bunzip2 enwiki-latest-pages-articles.xml.bz2
Und wenn es eine gzip
komprimierte Datei ist:
gunzip enwiki-latest-pages-articles.xml.gz