У меня есть диск в кодировке «Китайский упрощенный», скопированный из Windows.
А теперь я установил centos7 с традиционной китайской кодировкой символов.
1 Как мне смонтировать этот диск?
Я использую команду ntfs-3g /dev/sdb /mnt/windows -o locale=zh_CN.GBK, но тогда у меня все равно получается беспорядочное имя файла.
2 Как мне скопировать эти файлы?
Я использую команду cp -r, тогда она печатает
cp -r /mnt/7 /home/jl/iphone/7 cp: Файл '/mnt/7/20140206/\275̰\270/\261\270\277\316': Если вы хотите сохранить или сохранить файл, который вы хотите сохранить, или просто нажмите cp: Файл '/mnt/7/20140206/\275̰\270/֪ʶ\265\343': Невозможно удалить или удалить все файлы cp: Сохранить '/mnt/7/20140206/\277Ƽ\274\273': Невозможно удалить или удалить все файлы
Вы можете не читать это, это значит, что cp не может выполнить из-за неподходящего персонажа(?)
Очевидно, эта проблема вызвана различным разделителем пути в ОС.
Я попробовал convmv -f gbk -t big5 -r --notest /home/jl/文件/7, но тоже не получилось.
Стоит ли использовать scp для копирования этого каталога?
решение1
Во-первых, вы имеете дело с разными протоколами кодирования: Windows кодирует вUTF-16, тогда как для Linux и OSX значение по умолчанию —UTF-8.
Итак, хотя вы установили кодировкуUTF-8при монтировании вашей кучи данных в Linux, данные были закодированы с помощьюUTF-16от Windows.
Я подозреваю, что имена файлов содержат многобайтовые символы, которые не читаются правильно в UTF-8. Как правило, при работе с двуязычным персоналом я говорю им придерживаться недиакритических символов в UTF-8, которые являются первыми 128 символами) для имен файлов, чтобы избежать именно этого типа боли.
Различия в кодировках символов в именах файлов могут вызвать проблемы при восстановлении резервной копии TAR в системе с другими кодировками.
В любом случае, вы можете преобразовать кодировки с помощью ICU:http://site.icu-project.org/.
HTH ты превзошел-