在有圖像的頁面上無法選擇 Ghostscript 文本

在有圖像的頁面上無法選擇 Ghostscript 文本

正常編譯後,我正在使用以下ghostscript命令處理 PDF 文件,以產生(希望)與 PDF/A 相容的文件。

gs -dPDFA
   -sDEVICE=pdfwrite
   -dPDFACompatibilityPolicy=1
   -dPrinted=false
   -dPDFSETTINGS=/printer
   -dSAFER
   -dNOPAUSE
   -dQUIET
   -dBATCH
   -dNOOUTERSAVE 
   -sColorConversionStrategy=UseDeviceIndependentColor
   -sProcessColorModel=DeviceRGB
   -sOutputFile=thesis.pdf
   main.pdf pdfmarks

這大部分都有效(我的 PDF 檢視器中有一個工作大綱,超連結現在也可以工作),除了一件事。除包含圖像的頁面外,幾乎所有頁面上的文字都是可選擇和可複製的。圖像是其他 PDF 還是 PNG 並不重要。不過,Tikz 圖片和 MetaFont 圖片都很好。

我嘗試了不同的PDFSETTINGS,/prepress並且在該命令的早期迭代中也沒有-dSAFERand -dPrinted=false

原始 PDF 檔案是用 編譯的pdflatex,如果有什麼差別的話。

這個問題很難研究,因為幾乎所有的 Ghostscript 文件都包含「文字」和「圖像」這兩個字。

答案1

我首先會努力直接使用pdflatex或來建立符合 PDF/A 標準的 pdf。lualatex這將直接為您提供有效的 PDF/A:

\documentclass{article}

\usepackage[pdfa]{hyperref}
\usepackage{hyperxmp}[2020/03/01]

\author{me,him}
\title{How to create a PDF/A-1b document}

\immediate\pdfobj stream attr{/N 3} file{sRGB.icc}
\pdfcatalog{%
  /OutputIntents [ <<
    /Type /OutputIntent
    /S /GTS_PDFA1
      /DestOutputProfile \the\pdflastobj\space 0 R
    /OutputConditionIdentifier (sRGB IEC61966-2.1)
    /Info(sRGB IEC61966-2.1)
  >> ]
}

\begin{document}

lorem ipsum \url{http://stackexchange.com/}

\end{document}

此範例在 Acrobat DC 中驗證verapdf 1.14.8 皆使用 LuaLaTeX 和 pdfLaTeX 以及最新軟體包進行編譯。
預檢驗證結果
看起來 Graipher 的字型設定很危險。

如果您想稍後包含圖像,我建議包含已經驗證 pdf/a 的 pdf。具有嵌入顏色設定檔的 Jpg 影像可以運作,但某些驗證器要求嵌入影像元資料符合 PDF/A 標準。如果沒有 Acrobat Pro,這是很難實現的。使用 Ghostscript 也會遇到這個問題。 PNG 不起作用,因為它們不提供嵌入的顏色配置。

答案2

我遇到了類似的問題,透過更改為-dCompatibilityLevel=1.4 from解決了這個問題-dCompatibilityLevel=1.3

但不知道為什麼。

相關內容