работать с диском с другой кодировкой символов

работать с диском с другой кодировкой символов

У меня есть диск в кодировке «Китайский упрощенный», скопированный из Windows.

А теперь я установил centos7 с традиционной китайской кодировкой символов.

1 Как мне смонтировать этот диск?

Я использую команду ntfs-3g /dev/sdb /mnt/windows -o locale=zh_CN.GBK, но тогда у меня все равно получается беспорядочное имя файла.

2 Как мне скопировать эти файлы?

Я использую команду cp -r, тогда она печатает

cp -r /mnt/7 /home/jl/iphone/7 cp: Файл '/mnt/7/20140206/\275̰\270/\261\270\277\316': Если вы хотите сохранить или сохранить файл, который вы хотите сохранить, или просто нажмите cp: Файл '/mnt/7/20140206/\275̰\270/֪ʶ\265\343': Невозможно удалить или удалить все файлы cp: Сохранить '/mnt/7/20140206/\277Ƽ\274\273': Невозможно удалить или удалить все файлы

Вы можете не читать это, это значит, что cp не может выполнить из-за неподходящего персонажа(?)

Очевидно, эта проблема вызвана различным разделителем пути в ОС.

Я попробовал convmv -f gbk -t big5 -r --notest /home/jl/文件/7, но тоже не получилось. введите описание изображения здесь

Стоит ли использовать scp для копирования этого каталога?

решение1

Во-первых, вы имеете дело с разными протоколами кодирования: Windows кодирует вUTF-16, тогда как для Linux и OSX значение по умолчанию —UTF-8.

Итак, хотя вы установили кодировкуUTF-8при монтировании вашей кучи данных в Linux, данные были закодированы с помощьюUTF-16от Windows.

Я подозреваю, что имена файлов содержат многобайтовые символы, которые не читаются правильно в UTF-8. Как правило, при работе с двуязычным персоналом я говорю им придерживаться недиакритических символов в UTF-8, которые являются первыми 128 символами) для имен файлов, чтобы избежать именно этого типа боли.

Различия в кодировках символов в именах файлов могут вызвать проблемы при восстановлении резервной копии TAR в системе с другими кодировками.

В любом случае, вы можете преобразовать кодировки с помощью ICU:http://site.icu-project.org/.

HTH ты превзошел-

Связанный контент