破損し、パスワードで保護された、.docx 拡張子の Office 2010 Word 文書があります。この文書には内部にファイル リンクが含まれており、長さは約 1000 ページです。
できる限りのデータを節約したいので、いろいろ試してみました。
これを実現するためのプログラムやソースコードについて何かアイデアはありますか?
答え1
docx は、内部に多数のエントリが含まれる zip ファイルです。ステップ 1 では、WinZip や 7-zip などの zip ファイル ビューアーで docx を開いてみます。
ZIP が破損している場合は修復を試みることができますが、docx ドキュメントはパスワードで保護されているため、ZIP ファイル内の 1 つ以上のエントリが失われた場合の回復は困難または不可能になる可能性があります。
答え2
名前を .ZIP に変更し、修復ツールを使用して、特定の構造で XML ファイルとバイナリ ファイルが混在するコンテンツを参照します。
見るOffice XML 形式の構造.zip /.docx ファイルに含まれる内容について。