Portanto, tenho esse despejo da Wikipedia com cerca de 10 GB e denominado "enwiki-latest-pages-articles.xml.bz2". Tenho tentado os seguintes comandos no terminal para descompactar o dump:
tar jxf enwiki-latest-pages-articles.xml.bz2
E
tar xvf enwiki-latest-pages-articles.xml.bz2
Mas ambos retornam o seguinte erro
tar: This does not look like a tar archive
tar: Skipping to next header
Responder1
Você não pode usar o tar
comando porque o arquivo não é um arquivo .tar.*. Para descompactar um arquivo bzip2, use o seguinte comando (isso não preservará o arquivo .bz2 original):
bzip2 -d enwiki-latest-pages-articles.xml.bz2
Se quiser extraí-lo e manter o original, execute este comando:
bzip2 -dk enwiki-latest-pages-articles.xml.bz2
Fonte:https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
Responder2
Apenas use bunzip2
:
bunzip2 enwiki-latest-pages-articles.xml.bz2
E se for um gzip
arquivo compactado:
gunzip enwiki-latest-pages-articles.xml.gz