그래서 저는 이 위키피디아 덤프의 크기가 약 10GB이고 이름이 "enwiki-latest-pages-articles.xml.bz2"입니다. 덤프의 압축을 풀기 위해 터미널에서 다음 명령을 시도했습니다.
tar jxf enwiki-latest-pages-articles.xml.bz2
그리고
tar xvf enwiki-latest-pages-articles.xml.bz2
그러나 둘 다 다음 오류를 반환합니다.
tar: This does not look like a tar archive
tar: Skipping to next header
답변1
tar
아카이브가 .tar.* 파일이 아니기 때문에 명령을 사용할 수 없습니다 . bzip2 파일의 압축을 풀려면 다음 명령을 사용하십시오(원래 .bz2 파일은 보존되지 않음).
bzip2 -d enwiki-latest-pages-articles.xml.bz2
추출하고 원본을 유지하려면 다음 명령을 실행하십시오.
bzip2 -dk enwiki-latest-pages-articles.xml.bz2
원천:https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
답변2
그냥 사용하십시오 bunzip2
:
bunzip2 enwiki-latest-pages-articles.xml.bz2
압축된 파일 인 경우 gzip
:
gunzip enwiki-latest-pages-articles.xml.gz