Wie werden die Glyphennamen (Zeichennamen) in PDF-Dateien bestimmt?

Wie werden die Glyphennamen (Zeichennamen) in PDF-Dateien bestimmt?

PDF-Dateien verwenden intern GlyphenNamen. Beispielsweise könnte der Name von ( U+2248; TeX ), der in einer PDF-Datei vorkommt, lauten .\approxapproxequal

Man kann solche Namen in einer TeX-generierten PDF-Datei finden, indem man

  1. Kompilieren des TeX-Codes mit \pdfcompresslevel=0,
  2. die resultierende PDF-Datei als Textdatei prüfen und
  3. Suche nach Zeilen, die mit beginnen /CharSet.

(Informationen entnommen ausAntwort von Ulrike Fischeran anderer Stelle, wo weitere Informationen bereitgestellt werden).

Offenbar sind die Glyphennamen schriftartabhängig. Werden sie also durch die Schriftarten bestimmt? Verwenden alle Schriftformate solche Namen? Welche Schriftformate verwenden Textnamen? Haben alle Glyphen in allen PDF-Dateien solche Namen?

Wie werden die Glyphennamen in PDF-Dateien bestimmt?Wer hat die bestehenden bestimmt?Wofür sind sie?(Warum verweist PDF nicht auf die Glyphen mit Nummern? Offensichtlich verlassen sich einige Leser auf die Glyphennamen (siehe Link zur Frage zur Hyperlink-Erkennung weiter unten), sodass das PDF-Format oder einige LesermancheAnnahmen über diese Namen. Es muss einen Grund dafür geben, warum ein Zwischenname verwendet wird. Vielleicht hat dies mit dem Alter von Unicode im Verhältnis zu PDF zu tun.) Was gibt es sonst noch zu diesem Thema für einen (La)TeX-Benutzer zu wissen?

Bei mir ist das Problem mit den PDF-Glyphennamen hier aufgetreten:

Eine ähnliche Frage istSo finden Sie den richtigen Glyphennamen, der von \pdfglyphtounicode benötigt wird, aber zu diesem Thema gibt es noch mehr zu besprechen.

Antwort1

nach meinem Verständnis werden die Glyphennamen durch die Schriftart bestimmt. (Beachten Sie die Verwendung des Begriffs „Glyphe“; Zeichen und Glyphen sind verwandt, aber nicht austauschbar. Aber das ist eine andere Geschichte.)

ich verstehe es auch so, dass die von der Schriftart bereitgestellten Namen vom Schriftartlieferanten abhängen – sie können in irgendeiner Weise „bedeutend“ sein (z. B. ein ASCII-Buchstabe, ein Unicode, ein beschreibender Name usw.) oder es kann sich einfach um den internen Code eines Lieferanten handeln, wie es zu Zeiten des Metalldrucks der Fall war (wie in alten Auflistungen technischer Symbole von Monotype zu sehen ist).

Die Dinge können sich ändern, aber ... halten Sie nicht den Atem an.

zusätzlich zu dem, was Ulrike gesagt hat, verwendet Unicode auch Namen und Zahlen. Ein wichtiger (aber möglicherweise irrelevanter) Punkt hierbei ist, dass, sobald sowohl ein Name als auch eine Zahl zugewiesen sind,Sie werden nie geändert, selbst wenn sich der Name als falsch oder einfach nur als unüberlegt erweisen sollte.

Ein zweiter Punkt ist, dass einige Glyphennichtnotwendigerweise durch einen einzigen, eindeutigen Unicode benannt. Ein Unicode soll definierenBedeutung, nicht die Form. „Varianten“-Glyphen (mit derselben Bedeutung, aber unterschiedlicher Form) können auf zwei Arten durch mehrere Unicodes dargestellt werden:

  • durch die Verwendung eines kombinierenden diakritischen Zeichens, wie \nvarleqes eine Verbindung aus \leq(U+2264) und U+20D2 ist, „kombinierende lange vertikale Überlagerung“; fast keine durch eine vertikale Aufhebung negierten Beziehungen werden durch einzelne Unicodes dargestellt, und solange sich die Grundprinzipien der Unicode-Zuweisung nicht ändern, wird dies die Norm bleiben.

  • durch Hinzufügen eines definierten „Variantenselektors“ (U+FE00) zur Bezeichnunganerkannt(d. h. offiziell von Unicode) Varianten, die nicht durch Hinzufügen eines kombinierenden diakritischen Zeichens geändert werden können, wie \lvertneqq(kleiner als, aber ungleich mit vertikaler Negierung nur des Gleichheitszeichens, U+2268,U+FE00).

Unicode-Technischer Bericht Nr. 25,Unicode-Unterstützung für Mathematik, behandelt diese Methoden in den Abschnitten 2.17 und 2.18 (Seite 26 ff.).

verwandte Informationen