LaTeX で作成された PDF からどのようなデータを収集できますか?

LaTeX で作成された PDF からどのようなデータを収集できますか?

私は多くのビジネス ツールの作成に LaTeX を使用しています。また、これらのツールを世界中のさまざまなクライアントに送信しているため、PDF に埋め込まれたデータが、フォレンジック データ アナリストによって復元される可能性があるかどうかを知りたいと思いました。私は、たとえばフォーカス グループがドキュメントを最終形式に進化させるために連続的に修正を加える際に注目してほしいコメントを TeX コードに残すことがよくあります。ただし、これらのコメントを最終的に受け取るクライアントに見られたくはありません。フォーカス グループのコメントや、ソースを明らかにする可能性のあるインターネットからデータを取得するガジェットもです。

答え1

PDF が作成されるときに、いくつかの基本的なメタデータが PDF に含まれます。ここで最も明白なのは、PDF を生成するバイナリの名前があることです。これにより、興味のある人は、あなたが pdfTeX v1.40.11 (または任意のもの) を使用したことを知ることができます。MiKTeX (つまり Windows) を使用している場合は、その情報も含まれる可能性があります。また、 を使用してセットアップしたドキュメントの作成者やタイトルなど、自分で追加できるメタデータもありますhyperref。後者はスキップでき、前者は PDF の後処理によって上書きできます。その場合でも、フォントの使用によって TeX の使用が明らかになる可能性があります。たとえば、TeX の世界以外の人が Computer Modern を使用することはほとんどありません。

しかし、ないPDF に表示されるのは、入力内のコメントや削除された資料と関係があるわけではありません (1 つの例外あり)。TeX によって読み取られたが出力段階に到達しないテキストは、PDF にはまったく表示されません。唯一の例外は、ボックスまたはグラフィックをクリップした場合です。ボックス全体は「そこに」ありますが、クリップされていない部分のみが表示されます。

関連情報