При установке Linux (для локали GB) мне предлагается выбрать en_GB
, en_GB.UTF-8
и en_GB.ISO-8859-15
.
Какие факторы учитываются при выборе? Насколько мне известно, британский алфавит не использует UTF-8, или использует, но я не сталкивался и не осознавал, какие проблемы это вызывает на сервере.
Есть ли способ узнать, что может быть более подходящим для вашего случая? Я знаю, что установки баз данных, такие как Postgres, MySQL и SQLite, похоже, предпочитают локаль UTF.
решение1
Разница между этими опциями заключается в том, какая кодировка символов используется для текста. Если вы выберете en_GB, система будет использовать набор символов iso8859-1. Iso8859-15 примерно эквивалентен iso8859-1, но восемь кодовых точек изменили значение; например, символ валюты ¤ был заменен знаком евро €. Эти кодировки используют 8 бит на символ и, таким образом, ограничены фиксированными наборами из 256 различных символов (на практике даже меньше).
UTF-8 — это кодировка Unicode. Unicode — это всеобъемлющая схема представления символов, определяющая кодовые точки для более чем 128000 символов и эмодзи. Unicode определенно также поддерживает британский алфавит.
Я рекомендую использовать UTF-8, поскольку это надмножество других наборов символов, которое сегодня широко используется в Linux.