嘗試使用 printf 解碼作為參數傳入的 unicode 字符

Question 1

為了避免雙重展開問題（\u之前已處理過%s），您可以使用%b，至少在 Bash 中printf：

printf '%b\n' \\u0024 \\u0025

您可以透過多種方式預處理輸入：

set 0024 0025
printf '%b\n' "${@/#/\\u}"

獨立式printf,在 GNU coreutils 中實現，對 Unicode 字元規範有以下限制：

printf解釋 ISO C 99 中引入的兩種字元語法： ' \u' 表示 16 位元 Unicode (ISO/IEC 10646) 字符，指定為四個十六進位數字呵呵, 和 ' \U' 表示 32 位元 Unicode 字符，指定為八個十六進位數字哈哈哈哈。printf根據LC_CTYPE區域設定輸出 Unicode 字元。此語法無法指定 U+0000…U+009F、U+D800…U+DFFF 範圍內的 Unicode 字符，U+0024 ($)、U+0040 (@) 和 U+0060 (`) 除外。

這解釋了為什麼你不能%以這種方式生產。

Answer

為了避免雙重展開問題（\u之前已處理過%s），您可以使用%b，至少在 Bash 中printf：

printf '%b\n' \\u0024 \\u0025

您可以透過多種方式預處理輸入：

set 0024 0025
printf '%b\n' "${@/#/\\u}"

獨立式printf,在 GNU coreutils 中實現，對 Unicode 字元規範有以下限制：

printf解釋 ISO C 99 中引入的兩種字元語法： ' \u' 表示 16 位元 Unicode (ISO/IEC 10646) 字符，指定為四個十六進位數字呵呵, 和 ' \U' 表示 32 位元 Unicode 字符，指定為八個十六進位數字哈哈哈哈。printf根據LC_CTYPE區域設定輸出 Unicode 字元。此語法無法指定 U+0000…U+009F、U+D800…U+DFFF 範圍內的 Unicode 字符，U+0024 ($)、U+0040 (@) 和 U+0060 (`) 除外。

這解釋了為什麼你不能%以這種方式生產。

Question 2

標準printf實用程式不支援\uxxxx轉義序列，請參閱：https://pubs.opengroup.org/onlinepubs/9699919799/utilities/printf.html

假設這可以工作取決於可能存在於一些實作中（例如內建ksh）的擴展，但不能期望得到普遍支援。請參閱printf標準文件。

另一個問題似乎是你假設調用

printf '\u%s\n' 123

會產生與呼叫相同的結果：

printf '\u123\n'

這不起作用，因為printf逐個元素解析格式字串，但看不到預期的格式字串。

因此，即使您正在用來bash執行腳本，\uxx如果後面跟著兩個十六進制數字並且轉義序列按字面意思出現在格式字串中，您也可能會期望反斜線轉義被擴展。如果您想擴展 4 個十六進位數字，則需要\Uxxxx在格式字串中按字面意思進行。

Answer