Dies ist eine Best-Practice-Frage.
Soll ich Tex-Dateien in ASCII kodieren oder soll ich UTF-8 verwenden? Ist eines von beiden aus irgendeinem Grund (irgendein Grund) vorzuziehen, wenn im Tex-Dateicode nur ASCII-Zeichen und nichts anderes vorkommen?
(Für die direkt eingegebenen Zeichen in Fremdsprachen ist UTF-8 offensichtlich vorzuziehen, dies ist hier jedoch nicht der analysierte Fall.)
F1) Gibt es in diesem Fall Vorteile bei der Verwendung der ASCII-Eingabekodierung?
F2) Wenn ich eine in ASCII kodierte Tex-Datei habe und Text in ein UTF-8-kodiertes Dokument kopiere und einfüge, gibt es dann irgendwelche Probleme, wenn ich das UTF-8 speichere? Ich nehme an, das ist nicht der Fall: UTF-8 schließt ASCII ein, aber ich könnte mich irren. Tue ich das?
F3) Wenn ich Text aus einem UTF-8-kodierten Dokument in ein ASCII-kodiertes Dokument kopiere, gibt es dann irgendwelche Probleme? Ich gehe davon aus, dass nur ASCII-Zeichen kopiert und eingefügt werden?
Antwort1
UTF8 und ASCII sind für Zeichen im ASCII-Bereich Byte für Byte identisch. Wenn Sie also eine reine Textdatei haben, die ASCII-codiert ist, ist sie auch UTF-8-codiert. Und ähnlich verhält es sich, wenn sie UTF-8-codiert ist, aber nur Zeichen im Bereich x00 – x7F enthält. Dann werden diese direkt als sie selbst mit Bytes im gleichen Bereich codiert und sind daher gültige ASCII-Dateien.