У меня есть набор вложенных zip-файлов, и мне нужно перечислить имена файлов.без извлеченияархивы. Например:
- Zip1.zip
- текст 1
- текст2
- Zip2.zip
- Образец1
- Образец2
с помощью скрипта оболочки должен получиться такой список
Zip1.zip
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2
решение1
Флаг unzip -p перенаправит несжатые данные в stdout. К сожалению, unzip
по какой-то причине программа не имеет возможности читать из stdin. Адаптация однострочника python изэтотответ на аналогичный вопрос срабатывает.
например:
unzip -p Zip1.zip Zip1/zip2.zip| python -c 'import zipfile,sys,StringIO;print "\n".join(zipfile.ZipFile(StringIO.StringIO(sys.stdin.read())).namelist())'
Добавлено: Инструмент Java jar может читать из stdin. украдено изэтототвечать.
например:
unzip -p Zip1.zip Zip1/zip2.zip| jar -t
выход:
zip2/
zip2/Sample2
zip2/Sample1
Исходный zip-файл:
$ unzip -l Zip1.zip
Archive: Zip1.zip
Length Date Time Name
--------- ---------- ----- ----
0 2015-11-03 15:49 Zip1/
5 2015-11-03 15:49 Zip1/text1
5 2015-11-03 15:49 Zip1/text2
474 2015-11-03 15:48 Zip1/zip2.zip
--------- -------
484 4 files
Нашел соответствующую ветку Serverfault изтвой-комментарий.
Это не скрипт оболочки, но он делает то, что было предложено в исходном вопросе:
#!/usr/bin/python
# Usage: python list-zips.py <zipfile>
import zipfile
import io
import sys
def uz(f, parent=[]):
result = []
try:
zf = zipfile.ZipFile(f)
for e in zf.namelist():
path=parent+[e]
if e.lower().endswith(".zip"):
result += uz(io.BytesIO(zf.open(e).read()), path)
else:
result.append("/".join(path))
except Exception as ex:
return result
return result
print("\n".join(uz(open(sys.argv[1], "rb"), [sys.argv[1]])))
$ python list-zips.py Zip1.zip
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2