Así que tengo este volcado de Wikipedia con un tamaño de aproximadamente 10 GB y denominado "enwiki-latest-pages-articles.xml.bz2". He estado probando los siguientes comandos en la terminal para descomprimir el volcado:
tar jxf enwiki-latest-pages-articles.xml.bz2
Y
tar xvf enwiki-latest-pages-articles.xml.bz2
Pero ambos devuelven el siguiente error.
tar: This does not look like a tar archive
tar: Skipping to next header
Respuesta1
No puede usar el tar
comando porque el archivo no es un archivo .tar.*. Para descomprimir un archivo bzip2, use el siguiente comando (esto no conservará el archivo .bz2 original):
bzip2 -d enwiki-latest-pages-articles.xml.bz2
Si desea extraerlo y conservar el original, ejecute este comando:
bzip2 -dk enwiki-latest-pages-articles.xml.bz2
Fuente:https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
Respuesta2
Solo usa bunzip2
:
bunzip2 enwiki-latest-pages-articles.xml.bz2
Y si es un gzip
archivo comprimido:
gunzip enwiki-latest-pages-articles.xml.gz