GNU は大文字と小文字を区別せずにキリル文字の行をソートします

Question 1

「ru」は有効なロケールではないと思われます。コマンドを試してlang=ru locale、エラーメッセージが表示されるかどうかを確認してください。私のシステムでは、「ru」は無効なロケールであり、「ru_RU」は iso8859-5 です。utf-8 で動作させるには、ru_RU.UTF-8 が必要です。

$ LANG=ru locale
locale: Cannot set LC_CTYPE to default locale: No such file or directory
locale: Cannot set LC_MESSAGES to default locale: No such file or directory
locale: Cannot set LC_ALL to default locale: No such file or directory

ロケールに使用されている文字セットを見つけるには、次のlocaleツールを使用できます。

$ LANG=ru_RU locale -c -k charmap collate-codeset
LC_CTYPE
charmap="ISO-8859-5"
LC_COLLATE
collate-codeset="ISO-8859-5"

ロケールはカテゴリで定義されることに注意してください。LC_COLLATE カテゴリは、並べ替えに使用されるカテゴリです。LC_ALL を設定すると、それらすべてが上書きされます。または、名前付き環境変数を使用して個別に設定することも、LANG を設定してデフォルトを設定することもできます。ほとんどの人は、日常の使用には LC_ALL ではなく LANG を設定するでしょう。

ツールの出力ではlocale、LC_ALL または LANG に基づいて設定されたカテゴリは引用符で囲まれて表示されますが、独自の変数 (および設定されている場合は LC_ALL 自体、LC_ALL が設定されていない場合は LANG) によって設定されたカテゴリは引用符なしで表示されます。例:

$ LANG=en_US.UTF-8 LC_MESSAGES=ru_RU.UTF-8 locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
...
LC_MESSAGES=ru_RU.UTF-8
...
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

Answer

「ru」は有効なロケールではないと思われます。コマンドを試してlang=ru locale、エラーメッセージが表示されるかどうかを確認してください。私のシステムでは、「ru」は無効なロケールであり、「ru_RU」は iso8859-5 です。utf-8 で動作させるには、ru_RU.UTF-8 が必要です。

$ LANG=ru locale
locale: Cannot set LC_CTYPE to default locale: No such file or directory
locale: Cannot set LC_MESSAGES to default locale: No such file or directory
locale: Cannot set LC_ALL to default locale: No such file or directory

ロケールに使用されている文字セットを見つけるには、次のlocaleツールを使用できます。

$ LANG=ru_RU locale -c -k charmap collate-codeset
LC_CTYPE
charmap="ISO-8859-5"
LC_COLLATE
collate-codeset="ISO-8859-5"

ロケールはカテゴリで定義されることに注意してください。LC_COLLATE カテゴリは、並べ替えに使用されるカテゴリです。LC_ALL を設定すると、それらすべてが上書きされます。または、名前付き環境変数を使用して個別に設定することも、LANG を設定してデフォルトを設定することもできます。ほとんどの人は、日常の使用には LC_ALL ではなく LANG を設定するでしょう。

ツールの出力ではlocale、LC_ALL または LANG に基づいて設定されたカテゴリは引用符で囲まれて表示されますが、独自の変数 (および設定されている場合は LC_ALL 自体、LC_ALL が設定されていない場合は LANG) によって設定されたカテゴリは引用符なしで表示されます。例:

$ LANG=en_US.UTF-8 LC_MESSAGES=ru_RU.UTF-8 locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
...
LC_MESSAGES=ru_RU.UTF-8
...
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

Question 2

$ cat input.txt 
banana
coffee
кофе
Банан
Apple
Coffee
арбуз
apple
Banana
Кофе
банан
Арбуз

$ export LC_ALL=en_US.UTF-8 && sort --ignore-case input.txt
apple
Apple
banana
Banana
coffee
Coffee
арбуз
Арбуз
банан
Банан
кофе
Кофе

Answer

$ cat input.txt 
banana
coffee
кофе
Банан
Apple
Coffee
арбуз
apple
Banana
Кофе
банан
Арбуз

$ export LC_ALL=en_US.UTF-8 && sort --ignore-case input.txt
apple
Apple
banana
Banana
coffee
Coffee
арбуз
Арбуз
банан
Банан
кофе
Кофе

GNU は大文字と小文字を区別せずにキリル文字の行をソートします

答え1

答え2

関連情報