operar disco con diferente codificación de caracteres

operar disco con diferente codificación de caracteres

Tengo un disco con codificación de caracteres chino simplificado copiado de Windows.

Y ahora instalé centos7 con codificación de caracteres chinos tradicionales.

1 ¿Cómo podría montar este disco?

Utilizo el comando ntfs-3g /dev/sdb /mnt/windows -o locale=zh_CN.GBK pero todavía tengo un nombre de archivo desordenado.

2 ¿Cómo podría copiar estos archivos?

Utilizo el comando cp -r, luego imprime

cp -r /mnt/7 /home/jl/文件/7 cp: 無法存取 '/mnt/7/20140206/\275̰\270/\261\270\277\316': 不適用或不完整的多位元組字元或寬字元 cp: 無法存取 '/mnt/7/20140206/\275̰\270/֪ʶ\265\343': 不適用或不完整的多位元組字元或寬字元cp: 無法存取 '/mnt/7/20140206/\277Ƽ\274\273': 不適用或不完整的多位元組字元或寬字元

Puede que no leas esto, significa que cp no se pudo ejecutar debido a un carácter no apto (?)

Obviamente, este problema se debe a un separador de ruta diferente en el sistema operativo.

Y lo intenté convmv -f gbk -t big5 -r --notest /home/jl/文件/7 pero tampoco fallé. ingrese la descripción de la imagen aquí

¿Debo usar scp para copiar este directorio?

Respuesta1

En primer lugar, se trata de diferentes protocolos de codificación: Windows codifica enUTF-16, mientras que el valor predeterminado para Linux y OSX esUTF-8.

Entonces, aunque hayas configurado la codificación enUTF-8al montar su pila de datos en Linux, los datos se codificaron conUTF-16por Windows.

Sospecho que los nombres de archivos contienen caracteres de varios bytes que no se leen correctamente en UTF-8. Como regla general, cuando trabajo con personal bilingüe, les digo que se ciñan a caracteres no acentuados en UTF-8 (que son los primeros 128 caracteres) para los nombres de archivos para evitar exactamente este tipo de problemas.

Las diferencias en las codificaciones de caracteres en los nombres de archivos pueden causar problemas al restaurar una copia de seguridad TAR en un sistema con codificaciones diferentes.

De todos modos, puedes convertir codificaciones con ICU:http://site.icu-project.org/.

HTH estás fuera-

información relacionada