Сценарии, разрушающие апостроф/острый акцент

Сценарии, разрушающие апостроф/острый акцент

Я извлекаю большую коллекцию файлов PDF с сервера, и некоторые из них содержат этот символ '. На Mac это не проблема, и все работает нормально, но когда я запускаю это в среде Linux, происходит сбой. Если я пытаюсь вставить символ отдельно, ничего не происходит, а если я вставляю его в слово и пытаюсь удалить предыдущий символ, он превращается в знак ?.

введите описание изображения здесь введите описание изображения здесь

Есть ли решение, не требующее изменения имен файлов на сервере?

решение1

Похоже, это связано с настройками локали для контейнера Ubuntu, который вы используете.

На Stack Overflow есть ответ, который, похоже, сработает:https://stackoverflow.com/a/27102762/895323

Даже в Windows следующие проблемы не позволили мне использовать символы Unicode: docker run -it --rm ubuntu:20.04 bash.

Указав LANGпеременную окружения в соответствии с ответом SO, Unicode заработал.

docker run -e LANG=C.UTF-8 -it --rm ubuntu:20.04 bash

Связанный контент