Итак, у меня есть этот дамп Википедии размером около 10 ГБ и названный как "enwiki-latest-pages-articles.xml.bz2". Я пробовал следующие команды в терминале, чтобы распаковать дамп:
tar jxf enwiki-latest-pages-articles.xml.bz2
И
tar xvf enwiki-latest-pages-articles.xml.bz2
Но оба они возвращают следующую ошибку
tar: This does not look like a tar archive
tar: Skipping to next header
решение1
Вы не можете использовать tar
команду, поскольку архив не является файлом .tar.*. Чтобы распаковать файл bzip2, используйте следующую команду (она не сохранит исходный файл .bz2):
bzip2 -d enwiki-latest-pages-articles.xml.bz2
Если вы хотите извлечь его и сохранить оригинал, выполните следующую команду:
bzip2 -dk enwiki-latest-pages-articles.xml.bz2
Источник:https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
решение2
Просто используйте bunzip2
:
bunzip2 enwiki-latest-pages-articles.xml.bz2
А если это gzip
сжатый файл:
gunzip enwiki-latest-pages-articles.xml.gz