Ghostscript-Text ist auf Seiten mit Bildern nicht wählbar

Ghostscript-Text ist auf Seiten mit Bildern nicht wählbar

Nach der normalen Kompilierung verarbeite ich eine PDF-Datei mit dem folgenden ghostscriptBefehl, um eine (hoffentlich) PDF/A-kompatible Datei zu erstellen.

gs -dPDFA
   -sDEVICE=pdfwrite
   -dPDFACompatibilityPolicy=1
   -dPrinted=false
   -dPDFSETTINGS=/printer
   -dSAFER
   -dNOPAUSE
   -dQUIET
   -dBATCH
   -dNOOUTERSAVE 
   -sColorConversionStrategy=UseDeviceIndependentColor
   -sProcessColorModel=DeviceRGB
   -sOutputFile=thesis.pdf
   main.pdf pdfmarks

Das funktioniert größtenteils (ich habe eine funktionierende Gliederung in meinem PDF-Viewer und Hyperlinks funktionieren jetzt auch), bis auf eine Sache. Der Text ist auf fast allen Seiten auswählbar und kopierbar, außer auf Seiten, die Bilder enthalten. Dabei spielt es keine Rolle, ob das Bild ein anderes PDF oder ein PNG ist. Tikz-Bilder und MetaFont-Bilder sind jedoch in Ordnung.

Ich habe ein anderes ausprobiert PDFSETTINGS, /prepressund in einer früheren Iteration dieses Befehls auch ohne -dSAFERund -dPrinted=false.

Die ursprüngliche PDF-Datei wird mit kompiliert pdflatex, falls dies einen Unterschied macht.

Diese Frage ist ziemlich schwierig zu recherchieren, da fast jede Ghostscript-Dokumentation die Wörter „Text“ und „Bild“ enthält.

Antwort1

Ich würde mir Mühe geben, direkt mit pdflatexoder ein PDF/A-kompatibles PDF zu erstellen lualatex. Dadurch erhältst du direkt ein gültiges PDF/A:

\documentclass{article}

\usepackage[pdfa]{hyperref}
\usepackage{hyperxmp}[2020/03/01]

\author{me,him}
\title{How to create a PDF/A-1b document}

\immediate\pdfobj stream attr{/N 3} file{sRGB.icc}
\pdfcatalog{%
  /OutputIntents [ <<
    /Type /OutputIntent
    /S /GTS_PDFA1
      /DestOutputProfile \the\pdflastobj\space 0 R
    /OutputConditionIdentifier (sRGB IEC61966-2.1)
    /Info(sRGB IEC61966-2.1)
  >> ]
}

\begin{document}

lorem ipsum \url{http://stackexchange.com/}

\end{document}

Dieses Beispiel wird in Acrobat DC validiert.Undverapdf 1.14.8 sowohl bei Kompilierung mit LuaLaTeX als auch mit pdfLaTeX mit aktuellen Paketen.
Ergebnis der Preflight-Validierung
Es scheint, als ob die Schriftartenkonfiguration von Grapher nicht stimmt.

Wenn Sie Bilder später einfügen möchten, empfehle ich, PDF-Dateien einzubinden, die bereits PDF/A validieren. JPG-Bilder mit eingebetteten Farbprofilen können funktionieren, aber einige Validierer verlangen, dass die eingebetteten Bildmetadaten PDF/A-kompatibel sind. Dies ist ohne Acrobat Pro schwer zu erreichen. Dieses Problem würden Sie auch mit Ghostscript haben. PNG-Dateien funktionieren nicht, da sie keine eingebetteten Farbprofile bereitstellen.

Antwort2

-dCompatibilityLevel=1.4 Ich hatte ein ähnliches Problem, das ich durch die Änderung von behoben habe -dCompatibilityLevel=1.3.

Allerdings keine Ahnung, warum.

verwandte Informationen