答え1
DOC ファイルは (本来は)「レガシー」形式です。DOC ファイルはバイナリ形式の場合もあれば、Word 拡張子を持つプレーンテキスト RTF 形式の場合もあります。
DOCX ファイルは、プレーンテキスト XML とその他のデータ (画像など) がフォルダー ツリーに保存され、圧縮されて zip 形式で保存されています。拡張子を ZIP に変更して開くことができます (画像を抽出するのに便利です)。
Windows 上の Word 2010 では、「名前を付けて保存」を使用するとファイルの拡張子が DOC に変更されますが、ファイルは依然として圧縮された DOCX ファイルのままです。
RTF として保存すると、Windows 環境で動作を再現できる可能性があります。
私は、プロジェクト・グーテンベルクからランダムに選んだ本の 1 ページのテキストを使ってテストを行いました。
- RTF = 205KB
- DOCX = 25KB
- サードパーティのソフトウェアを使用して圧縮された RTF = 31KB
したがって、ファイル サイズの違いは ZIP 圧縮によるものであると推測されます。
保護されたビューですか? ファイルが破損しているのかもしれませんし、VBA マクロが埋め込まれていて、マクロ ポリシーが 100% ロックダウンされているのかもしれません。誰にもわかりません。その質問は別途お願いします。