Под «проблемой неправильной кодировки диакритических знаков» я подразумеваю проблему, при которой иногда в блогах «é» превращается в «Ã©», а также похожую проблему для других диакритических знаков.
Я знал, что одной из причин является неверная настройка DB_CHARSET базы данных. Однако я думаю, есть ли расширение Chrome, которое решает эту проблему со стороны клиента. Например, оно может «обнаруживать» плохие комбинации символов, такие как «Ã©», а затем просто заменять их на «é» или просто выполнять кодирование и декодирование, как показано ниже:
Если текст
Гипотеза Римана, после того как мы потеряли надежду на доказательство с помощью методов теории функций, мы сегодня пришли в новый день, в котором неразделимое доказательство гипотезы Артена о функциях L, эти две проблемы представляют собой два аспекта одного и того же арифметико-алгебраического вопроса, поскольку одновременное исследование всех циклотомических расширений данного числа играло без малейшей роли. решимый.
тогда, делая .encode("Windows-1252").decode("utf-8")
это, становится
Гипотеза Римана, после того как мы потеряли надежду на доказательство с помощью методов теории функций, мы сегодня же увидели новый день, в котором неразрывно связана гипотеза Артена о функциях L; эти две проблемы представляют собой два аспекта одного и того же арифметико-алгебраического вопроса, тогда как одновременное исследование всех циклотомических расширений числа чисел дало нам возможность играть без решающей роли.