Listando arquivos de arquivos zip aninhados sem extrair

Listando arquivos de arquivos zip aninhados sem extrair

Eu tenho um conjunto de arquivos zip aninhados e preciso listar os nomes dos arquivossem extrairos arquivos. Por exemplo:

  • Zip1.zip
    • texto 1
    • texto2
    • Zip2.zip
      • Amostra1
      • Amostra2

com algum script de shell deve resultar em uma lista como

Zip1.zip
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2

Responder1

O sinalizador unzip -p canalizará os dados descompactados para stdout. Infelizmente, o unzipprograma não tem a opção de ler stdin por algum motivo. Adaptando o python one liner deesseresponder a uma pergunta semelhante resolve.

por exemplo:

unzip -p Zip1.zip Zip1/zip2.zip| python -c 'import zipfile,sys,StringIO;print "\n".join(zipfile.ZipFile(StringIO.StringIO(sys.stdin.read())).namelist())'

Adicionado: a ferramenta Java jar pode ler stdin. roubado deesseresponder.

por exemplo:

unzip -p Zip1.zip  Zip1/zip2.zip| jar -t

saída:

zip2/
zip2/Sample2
zip2/Sample1

arquivo zip original:

$ unzip -l Zip1.zip 
Archive:  Zip1.zip
  Length      Date    Time    Name
---------  ---------- -----   ----
        0  2015-11-03 15:49   Zip1/
        5  2015-11-03 15:49   Zip1/text1
        5  2015-11-03 15:49   Zip1/text2
      474  2015-11-03 15:48   Zip1/zip2.zip
---------                     -------
      484                     4 files

Encontrou o thread Serverfault relevante deseu-Comente.


Este não é um script de shell, mas faz o que foi sugerido na pergunta original:

#!/usr/bin/python
# Usage: python list-zips.py <zipfile>

import zipfile
import io
import sys

def uz(f, parent=[]):

    result = []
    try:
        zf = zipfile.ZipFile(f)
        for e in zf.namelist():
            path=parent+[e]
            if e.lower().endswith(".zip"):
                result += uz(io.BytesIO(zf.open(e).read()), path)
            else:
                result.append("/".join(path))

    except Exception as ex:
        return result

    return result

print("\n".join(uz(open(sys.argv[1], "rb"), [sys.argv[1]])))

$ python list-zips.py Zip1.zip 
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2

informação relacionada