
저는 많은 비즈니스 도구를 만드는 데 LaTeX를 사용하고 이를 전 세계의 다양한 고객에게 보내기 때문에 법의학 데이터 분석가가 복구할 수 있는 PDF에 포함된 데이터가 있는지 알고 싶었습니다. 나는 종종 TeX 코드에 주석을 남기는데, 예를 들어 포커스 그룹이 문서를 최종 형식으로 발전시키기 위해 연속적인 수정을 하는 동안 알아차리기를 바랍니다. 그러나 나는 이러한 코멘트를 궁극적으로 받는 클라이언트가 보는 것을 원하지 않습니다. 포커스 그룹의 댓글이나 출처를 밝힐 수 있는 인터넷에서 데이터를 가져오는 모든 장치도 마찬가지입니다.
답변1
일부 기본 메타데이터는 PDF가 생성될 때 PDF에 포함됩니다. 여기서 가장 분명한 것은 PDF를 생성하는 바이너리의 이름을 갖게 되므로 관심 있는 사람이 귀하가 pdfTeX v1.40.11(또는 무엇이든)을 사용했다는 것을 알 수 있습니다. MiKTeX(그래서 Windows)를 사용한다는 사실도 여기에 포함될 수 있습니다. 예를 들어 를 사용하여 설정한 문서의 작성자 또는 제목과 같이 직접 추가할 수 있는 메타데이터도 있습니다 hyperref
. 후자를 건너뛸 수 있으며 전자는 PDF 후처리를 통해 덮어쓸 수 있습니다. 글꼴 사용은 그때에도 여전히 TeX 사용을 방해할 가능성이 높습니다. 예를 들어 TeX 세계 외부의 사람들은 Computer Modern을 사용하지 않을 것입니다.
그러나 무엇을 하는가?~ 아니다PDF에 나타나는 것은 입력에 있는 주석이나 삭제된 자료와 관련이 있습니다(한 가지 예외가 있음). TeX에서 읽은 텍스트는 출력 단계에 도달하지 못하며 PDF에는 전혀 포함되지 않습니다. 한 가지 예외는 상자나 그래픽을 자르는 경우입니다. 전체 상자는 '거기' 있지만 잘리지 않은 부분만 표시됩니다.