我有一個從 Windows 複製的簡體中文字元編碼的磁碟。
現在我安裝的是centos7,使用的是繁體中文字元編碼。
1 如何掛載該磁碟?
我使用命令 ntfs-3g /dev/sdb /mnt/windows -o locale=zh_CN.GBK 但我仍然得到混亂的檔案名稱。
2 如何複製這些文件?
我使用命令 cp -r ,然後它列印
cp -r /mnt/7 /home/jl/檔案/7 cp: 無法存取 '/mnt/7/20140206/\275̰\270/\261\270\277\316': 不適用或不完整的多位元組字符或寬字符cp: 無法存取'/mnt/7/20140206/\275̰\270/֪ʶ\265\343': 不適用或不完整的多位元組字符或寬字符cp:無法存取'/mnt/7/20140206/\277Ƽ\274\273': 不適用或不完整的多位元組字元或寬字符
你可能沒有讀過這篇文章,這意味著 cp 由於字元不合適而無法執行(?)
這個問題顯然是由作業系統中不同的路徑分隔符號所引起的。
我嘗試了 convmv -f gbk -t big5 -r --notest /home/jl/檔案/7 但也失敗了。
我應該使用 scp 複製這個目錄嗎?
答案1
首先,您正在處理不同的編碼協定:Windows 編碼UTF-16,而 Linux 和 OSX 的預設值是UTF-8。
因此,儘管您已將編碼設定為UTF-8在 Linux 中安裝資料堆時,資料被編碼為UTF-16透過Windows。
我懷疑檔名包含多字節字符,這些字符在 UTF-8 中無法正確讀取。作為一般規則,當與雙語員工合作時,我告訴他們堅持使用 UTF-8 中的非重音字元(即前 128 個字元)作為文件名,以避免這種痛苦。
檔案名稱中字元編碼的差異可能會導致將 TAR 備份還原到具有不同編碼的系統時出現問題。
不管怎樣,你可以用 ICU 轉換編碼:http://site.icu-project.org/。
HTH你出去-