아포스트로피/정확 악센트 분리 스크립트

아포스트로피/정확 악센트 분리 스크립트

서버에서 대규모 PDF 파일 모음을 가져오고 있는데 그 중 일부에는 '.'라는 문자가 포함되어 있습니다. Mac에서는 문제가 없으며 모든 것이 잘 작동하지만 Linux 환경에서 실행하면 실패합니다. 문자를 붙여넣으려고 하면 아무 일도 일어나지 않으며, 단어 안에 붙여넣고 이전 문자를 제거하려고 하면 ? 표시.

여기에 이미지 설명을 입력하세요 여기에 이미지 설명을 입력하세요

서버의 파일 이름을 변경하지 않는 솔루션이 있습니까?

답변1

이는 실행 중인 Ubuntu 컨테이너의 로케일 설정과 관련된 것 같습니다.

Stack Overflow에는 작동할 것으로 보이는 답변이 있습니다.https://stackoverflow.com/a/27102762/895323

Windows에서도 다음과 같은 이유로 유니코드 문자를 사용할 수 없습니다 docker run -it --rm ubuntu:20.04 bash.

LANGSO 답변에 따라 환경 변수를 지정하면 유니코드가 작동했습니다.

docker run -e LANG=C.UTF-8 -it --rm ubuntu:20.04 bash

관련 정보