Ich habe eine PDF-Datei mit einigen Unicode-Zeichen (siehe Bild).
Ich kann diese Zeichen in die Zwischenablage kopieren und beispielsweise in MS Word einfügen und sehe das Zeichen als einzelnes Quadrat mit einem Fragezeichen darin, wahrscheinlich weil die entsprechende Schriftart auf meinem System fehlt.
Ich möchte den Zeichencode in UTF und seinen Namen erhalten. Wie kann ich sie bekommen? Hier sind die Zeichen, die mich interessieren – vielleicht kann man sie direkt erkennen? Eine allgemeine Lösung für PDF und Unicode wäre jedenfalls toll.
Antwort1
Platzieren Sie in MS Word den Cursor direkt hinter einem Zeichen und geben Sie Alt X ein (d. h. drücken Sie die X-Taste, während Sie die Alt-Taste gedrückt halten). In jeder einigermaßen modernen Version von Word wird das Zeichen dadurch in seine Unicode-Codenummer umgewandelt. Um den Namen zu erhalten, können Sie dann Folgendes besuchen:http://www.unicode.orgoder verwenden Sie beispielsweise das Zeichentabellenprogramm in Windows. Oder Sie könnten installierenBabelPad, ein großartiger Unicode-Editor, der die Unicode-Nummer und den Unicode-Namen jedes Zeichens anzeigt, wenn Sie den Cursor direkt davor bewegen.
Alternativ, für mehr Spaß vielleicht, können Sie verwendenhttp://shapecatcher.com/und zeichnen Sie das Zeichen. Bei einfachen Mustern ist das ziemlich effektiv. Es hat sofort erkannt, dass Ihr erstes Zeichen „Weißes Quadrat mit oberem rechten Quadranten“ U+25F3 ist, anhand meiner ziemlich unbeholfenen Zeichnung.