У меня есть поврежденный, защищенный паролем документ Office 2010 Word с расширением .docx, внутри которого находятся ссылки на файлы, и который содержит около 1000 страниц.
Я хочу сохранить все данные, которые смогу. Я пробовал много разных вещей..
Есть ли какие-нибудь идеи по поводу программ или исходного кода, как это сделать?
решение1
docx — это zip-файлы с несколькими записями внутри. Шаг 1 — попытаться открыть docx в просмотрщике zip-файлов, таком как WinZip или 7-zip.
Если ZIP-файл поврежден, вы можете попытаться восстановить его, однако, поскольку ваш документ docx защищен паролем, восстановление в случае потери одной или нескольких записей в zip-файле может оказаться затруднительным или невозможным.
решение2
Переименуйте его в .ZIP, а затем воспользуйтесь инструментом восстановления, чтобы просмотреть содержимое, представляющее собой смесь XML-файлов и двоичных файлов в определенной структуре.
ВидетьСтруктура форматов Office XMLдля того, что содержится в файле .zip /.docx.