所以我有這個維基百科轉儲,大小約 10gb,命名為「enwiki-latest-pages-articles.xml.bz2」。我一直在終端機中嘗試以下命令來解壓縮轉儲:
tar jxf enwiki-latest-pages-articles.xml.bz2
和
tar xvf enwiki-latest-pages-articles.xml.bz2
但他們都回傳以下錯誤
tar: This does not look like a tar archive
tar: Skipping to next header
答案1
您無法使用該tar
命令,因為存檔不是 .tar.* 檔案。要解壓縮 bzip2 文件,請使用以下命令(這不會保留原始 .bz2 文件):
bzip2 -d enwiki-latest-pages-articles.xml.bz2
如果您想提取它並保留原始文件,請執行以下命令:
bzip2 -dk enwiki-latest-pages-articles.xml.bz2
來源:https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
答案2
只需使用bunzip2
:
bunzip2 enwiki-latest-pages-articles.xml.bz2
如果它是gzip
壓縮檔:
gunzip enwiki-latest-pages-articles.xml.gz