Diskette mit unterschiedlicher Zeichenkodierung betreiben

Diskette mit unterschiedlicher Zeichenkodierung betreiben

Ich habe eine Diskette mit der Zeichenkodierung „vereinfachtes Chinesisch“ von Windows kopiert.

Und jetzt habe ich CentOS7 mit traditioneller chinesischer Zeichenkodierung installiert.

1 Wie kann ich diese Festplatte mounten?

Ich verwende den Befehl ntfs-3g /dev/sdb /mnt/windows -o locale=zh_CN.GBK, aber der Dateiname ist trotzdem unordentlich.

2 Wie kann ich diese Dateien kopieren?

Ich verwende den Befehl cp -r, dann druckt es

cp -r /mnt/7 /home/jl/Datei/7 cp: Angenommen, Sie haben die Datei '/mnt/7/20140206/\275̰\270/\261\270\277\316': Angenommen, Sie haben die Datei '/mnt/7/20140206/\275̰\270/\261\270\277\316': Angenommen, Sie haben die Datei '/mnt/7/20140206/\275̰\270/֪ʶ\265\343': Angenommen, Sie haben die Datei '/mnt/7/20140206/\275̰\270/֪ʶ\265\343' cp: Ereignis „/mnt/7/20140206/\277Ƽ\274\273“: Zu viele zufällig ausgewählte Elemente

Sie haben das möglicherweise nicht gelesen, es bedeutet, dass cp aufgrund eines ungeeigneten Charakters nicht ausgeführt werden konnte(?)

Dieses Problem wird offensichtlich durch unterschiedliche Pfadtrennzeichen im Betriebssystem verursacht.

Und ich habe convmv -f gbk -t big5 -r --notest /home/jl/文件/7 versucht, aber beides ist fehlgeschlagen. Bildbeschreibung hier eingeben

Soll ich zum Kopieren dieses Verzeichnisses scp verwenden?

Antwort1

Erstens haben Sie es mit verschiedenen Kodierungsprotokollen zu tun: Windows kodiert inUTF-16, während der Standard für Linux und OSX istUTF-8.

Obwohl Sie die Kodierung aufUTF-8beim Mounten Ihres Datenstapels in Linux wurden die Daten kodiert mitUTF-16von Windows.

Ich vermute, dass die Dateinamen Mehrbyte-Zeichen enthalten, die in UTF-8 nicht richtig gelesen werden. Wenn ich mit zweisprachigem Personal arbeite, rate ich ihnen grundsätzlich, sich bei Dateinamen an Zeichen ohne Akzent in UTF-8 (die ersten 128 Zeichen) zu halten, um genau diese Art von Problemen zu vermeiden.

Unterschiede in der Zeichenkodierung von Dateinamen können bei der Wiederherstellung einer TAR-Sicherung auf einem System mit anderer Kodierung zu Problemen führen.

Trotzdem können Sie Kodierungen mit ICU konvertieren:http://site.icu-project.org/.

HTH, du bist raus-

verwandte Informationen