約 10 GB のサイズで、「enwiki-latest-pages-articles.xml.bz2」という名前が付けられたこの Wikipedia ダンプがあります。ターミナルで次のコマンドを実行してダンプを解凍しようとしています。
tar jxf enwiki-latest-pages-articles.xml.bz2
そして
tar xvf enwiki-latest-pages-articles.xml.bz2
しかし、どちらも次のエラーを返します
tar: This does not look like a tar archive
tar: Skipping to next header
答え1
tar
アーカイブが .tar.* ファイルではないため、このコマンドは使用できません。bzip2 ファイルを解凍するには、次のコマンドを使用します (元の .bz2 ファイルは保持されません)。
bzip2 -d enwiki-latest-pages-articles.xml.bz2
抽出して元のファイルを保持する場合は、次のコマンドを実行します。
bzip2 -dk enwiki-latest-pages-articles.xml.bz2
答え2
次のように使用しますbunzip2
:
bunzip2 enwiki-latest-pages-articles.xml.bz2
圧縮ファイルの場合gzip
:
gunzip enwiki-latest-pages-articles.xml.gz