Skripte zur Akzenttrennung mit Apostroph/Akut

Skripte zur Akzenttrennung mit Apostroph/Akut

Ich ziehe eine große Sammlung von PDF-Dateien von einem Server und einige davon enthalten dieses Zeichen '. Auf dem Mac ist das kein Problem und alles funktioniert einwandfrei, aber wenn ich es in einer Linux-Umgebung ausführe, schlägt es fehl. Wenn ich versuche, das Zeichen allein einzufügen, passiert nichts, und wenn ich es in ein Wort einfüge und versuche, das vorherige Zeichen zu entfernen, wird es zu einem ?-Zeichen.

Bildbeschreibung hier eingeben Bildbeschreibung hier eingeben

Gibt es eine Lösung, bei der die Dateinamen auf dem Server nicht geändert werden müssen?

Antwort1

Dies scheint mit den Gebietsschemaeinstellungen für den von Ihnen ausgeführten Ubuntu-Container zusammenzuhängen.

Stack Overflow hat eine Antwort, die anscheinend funktionieren wird:https://stackoverflow.com/a/27102762/895323

Sogar unter Windows hat mich Folgendes daran gehindert, Unicode-Zeichen zu verwenden: docker run -it --rm ubuntu:20.04 bash.

Durch Angabe der LANGUmgebungsvariable gemäß der SO-Antwort funktionierte Unicode.

docker run -e LANG=C.UTF-8 -it --rm ubuntu:20.04 bash

verwandte Informationen