Windows에서 복사한 중국어 간체 문자 인코딩 디스크가 있습니다.
이제 중국어 번체 문자 인코딩을 사용하여 centos7을 설치했습니다.
1 이 디스크를 어떻게 마운트할 수 있나요?
ntfs-3g /dev/sdb /mnt/windows -o locale=zh_CN.GBK 명령을 사용했지만 여전히 지저분한 파일 이름이 있습니다.
2 이 파일을 어떻게 복사할 수 있나요?
cp -r 명령을 사용하면 인쇄됩니다.
cp -r /mnt/7 /home/jl/文件/7 cp: 無法存取 '/mnt/7/20140206/\275̰\270/\261\270\277\316': 不適用或不完整多位元組字元或寬字字 cp: 無法存取 '/mnt/7/20140206/\275̰\270/֪ʶ\265\343': 不適用或不完整 多位元組字元或寬字文cp: 無법存取 '/mnt/7/20140206/\277SON\274\273': 不適用或不完整的多位元組字元或寬字文
이 내용을 읽지 못할 수도 있습니다. 이는 부적합한 문자(?)로 인해 cp가 실행될 수 없음을 의미합니다.
이 문제는 분명히 OS의 다른 경로 구분 기호로 인해 발생합니다.
그리고 나는 convmv -f gbk -t big5 -r --notest /home/jl/文件/7을 시도했지만 둘 중 하나도 실패했습니다.
이 디렉토리를 복사하려면 scp를 사용해야 합니까?
답변1
첫째, 다양한 인코딩 프로토콜을 다루고 있습니다. Windows는 다음과 같이 인코딩합니다.UTF-16, Linux 및 OSX의 기본값은 다음과 같습니다.UTF-8.
따라서 인코딩을 다음으로 설정했지만UTF-8Linux에 데이터 더미를 탑재할 때 데이터는 다음과 같이 인코딩되었습니다.UTF-16Windows로.
파일 이름에 UTF-8에서 올바르게 읽히지 않는 멀티바이트 문자가 포함된 것 같습니다. 일반적으로 이중 언어를 구사하는 직원과 작업할 때 이러한 유형의 고통을 피하기 위해 파일 이름에 처음 128자인 UTF-8의 악센트가 없는 문자를 사용하라고 지시합니다.
파일 이름의 문자 인코딩 차이로 인해 TAR 백업을 다른 인코딩을 사용하는 시스템으로 복원하는 데 어려움을 겪을 수 있습니다.
어쨌든 ICU를 사용하여 인코딩을 변환할 수 있습니다.http://site.icu-project.org/.
HTH 너 아웃-