Erforderliche Zeichensätze zur korrekten Anzeige von „zalgo“

Erforderliche Zeichensätze zur korrekten Anzeige von „zalgo“

Die folgende Antwort auf Stack Overflow ist bekannt für ihr überzeugendes Argument gegen die Verwendung von regulären Ausdrücken zum Parsen von HTML:https://stackoverflow.com/a/1732454/505154

Der Inhalt des Beitrags wird zunehmend beschädigt und sollte am Ende etwa so aussehen:

Zalgo richtig gerendert

Auf meinem Windows XP-Laptop sehe ich jedoch Folgendes:

Zalgo durch Boxen ersetzt

Wie kann ich diese „Zeichen“ richtig anzeigen?

Antwort1

Am einfachsten ist es, eine ausreichend große Schriftart herunterzuladen und zu installieren, wie zum BeispielSymbola, und verwenden Sie Firefox oder Chrome.

Das Problem ist zweifacher Natur. Erstens enthält der Text kombinierte diakritische Zeichen, die von den mit Windows XP mitgelieferten Schriftarten nicht unterstützt werden. Es gibt einige kostenlose Schriftarten, mit denen Sie dieses Problem beheben können. Zweitens kann der Internet Explorer Zeichen schlecht darstellen, wenn keine der in der entsprechenden font-familyListe aufgeführten Schriftarten ein Zeichen in einem HTML-Dokument abdeckt. Chrome und Firefox machen das viel besser; sogar Firefox 3, den ich in einem virtuellen Windows XP-System getestet habe, scheint mit der Situation gut zurechtzukommen: Er übernimmt die fehlenden Zeichen aus anderen Schriftarten im System.

Neben Seiten, die auf kindische Weise mit der Kombination diakritischer Zeichen spielen, gibt es echte Seiten, die solche Zeichen verwenden. Es ist also gut, vorbereitet zu sein. Es gibt keine einzige Schriftart, die alle Zeichen abdeckt, also installieren Sie einfach nach Bedarf zusätzliche Schriftarten; Alan Wood hat eine nette Seite fürSchriftarten herunterladenmit großem Charakterrepertoire.

Antwort2

Es ist mehr als nur der Zeichensatz.

Um dies richtig anzuzeigen, müssen der Client, der den Text rendert, und alle hierfür verwendeten Bibliotheken die Kombination von Unicode-Markierungen unterstützen. Zudem müssen sie über die erforderlichen Schriftarten und die Möglichkeit zur Font-Stitching-Funktion verfügen, um Schriftarten nach Bedarf kombinieren zu können.

ICHdenkenDie Hauptschriftart ist Microsoft Sans Serif oder Arial Unicode MS Regular, die standardmäßig in jeder Windows-Version enthalten ist und seit der Erstveröffentlichung für XP umfassend aktualisiert wurde, wahrscheinlich um alle Unicode-Diakritika einzuschließen, die hier fehlen. Möglicherweise sind hier auch andere Schriftarten im Spiel, die verwendet werden, um Lücken in der Hauptschriftart zu füllen, wenn ein bestimmtes Diakritikum fehlt. Ich bin mir nicht sicher, welche rechtlichen Konsequenzen es hat, eine Kopie der aktualisierten Schriftarten herunterzuladen, ohne dafür zu bezahlen (ohne Windows Vista oder Windows 7 oder Windows 8 für den Laptop zu kaufen).

Wenn das Problem darin liegt, dass die Rendering-Bibliothek die Kombination diakritischer Zeichen nicht unterstützt, können Sie den Text auch mit keiner Schriftart richtig anzeigen. Ihre einzige Möglichkeit besteht darin, die Anwendung und/oder die Bibliotheken, die sie zum Rendern von Text verwendet, zu aktualisieren.

verwandte Informationen