撇號/重音符號打破腳本

撇號/重音符號打破腳本

我正在從伺服器中提取大量 pdf 文件,其中一些包含此字元 '.在 mac 上這是沒有問題的,一切都正常,但是當我在 Linux 環境上運行它時,它會失敗。如果我嘗試將字符貼到它自己的字符中,則什麼也不會發生,如果我將它粘貼到一個單詞中並嘗試刪除前一個字符,它會變成一個?標記。

在此輸入影像描述 在此輸入影像描述

有沒有不涉及更改伺服器上的檔案名稱的解決方案?

答案1

這看起來與您正在運行的 Ubuntu 容器的區域設定有關。

Stack Overflow 有一個看起來可行的答案:https://stackoverflow.com/a/27102762/895323

即使在 Windows 上,以下內容也阻止我使用 Unicode 字元:docker run -it --rm ubuntu:20.04 bash

LANG透過根據 SO 答案指定環境變量,Unicode 起作用了。

docker run -e LANG=C.UTF-8 -it --rm ubuntu:20.04 bash

相關內容