標記 PDF:從 pdftex 存取 /Pages 物件?

標記 PDF:從 pdftex 存取 /Pages 物件?

我正在努力標記在 pdflatex 中產生的 PDF,並且我已經達到了我認為需要添加對/Pages目錄中物件的參考的程度。 (具體來說,在下面/ParentTree/StructTreeRoot儘管標準文件對我來說非常神秘,但關於真正屬於這裡的內容。)。但 pdftex 手冊似乎沒有透露任何執行此操作的機制。有嗎?

或者,如果有更好的方法用 pdflatex 標記 PDF(“切換到 ConTeXt”不符合條件),我很高興避免重新發明輪子。

答案1

/ParentTree 與 /Pages 字典沒有直接關係。它是一組引用,每個「虛擬頁面」對應一個引用;其中包括所有註釋、圖像和圖像遮罩、XObject 以及實際頁面。

實際頁面的引用是每個標記內容的結構父級的數組,由其 MCID 整數索引。除非您產生完全標記的 PDF,否則這些都沒有任何用處。我目前正在為此編寫一個 LaTeX 包,使用 pdfTeX 作為引擎。

如果您需要更具體的幫助或範例,請在清單外與我聯絡。

相關內容