![Listando arquivos de arquivos zip aninhados sem extrair](https://rvso.com/image/76404/Listando%20arquivos%20de%20arquivos%20zip%20aninhados%20sem%20extrair.png)
Eu tenho um conjunto de arquivos zip aninhados e preciso listar os nomes dos arquivossem extrairos arquivos. Por exemplo:
- Zip1.zip
- texto 1
- texto2
- Zip2.zip
- Amostra1
- Amostra2
com algum script de shell deve resultar em uma lista como
Zip1.zip
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2
Responder1
O sinalizador unzip -p canalizará os dados descompactados para stdout. Infelizmente, o unzip
programa não tem a opção de ler stdin por algum motivo. Adaptando o python one liner deesseresponder a uma pergunta semelhante resolve.
por exemplo:
unzip -p Zip1.zip Zip1/zip2.zip| python -c 'import zipfile,sys,StringIO;print "\n".join(zipfile.ZipFile(StringIO.StringIO(sys.stdin.read())).namelist())'
Adicionado: a ferramenta Java jar pode ler stdin. roubado deesseresponder.
por exemplo:
unzip -p Zip1.zip Zip1/zip2.zip| jar -t
saída:
zip2/
zip2/Sample2
zip2/Sample1
arquivo zip original:
$ unzip -l Zip1.zip
Archive: Zip1.zip
Length Date Time Name
--------- ---------- ----- ----
0 2015-11-03 15:49 Zip1/
5 2015-11-03 15:49 Zip1/text1
5 2015-11-03 15:49 Zip1/text2
474 2015-11-03 15:48 Zip1/zip2.zip
--------- -------
484 4 files
Encontrou o thread Serverfault relevante deseu-Comente.
Este não é um script de shell, mas faz o que foi sugerido na pergunta original:
#!/usr/bin/python
# Usage: python list-zips.py <zipfile>
import zipfile
import io
import sys
def uz(f, parent=[]):
result = []
try:
zf = zipfile.ZipFile(f)
for e in zf.namelist():
path=parent+[e]
if e.lower().endswith(".zip"):
result += uz(io.BytesIO(zf.open(e).read()), path)
else:
result.append("/".join(path))
except Exception as ex:
return result
return result
print("\n".join(uz(open(sys.argv[1], "rb"), [sys.argv[1]])))
$ python list-zips.py Zip1.zip
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2