operar disco com codificação de caracteres diferente

Question

Em primeiro lugar, você está lidando com diferentes protocolos de codificação: o Windows codifica emUTF-16, enquanto o padrão para Linux e OSX éUTF-8.

Então, embora você tenha definido a codificação paraUTF-8ao montar sua pilha de dados no Linux, os dados foram codificados comUTF-16pelo Windows.

Suspeito que os nomes dos arquivos contenham caracteres multibyte que não estão sendo lidos corretamente em UTF-8. Como regra geral, ao trabalhar com funcionários bilíngues, eu digo a eles para usarem caracteres não acentuados em UTF-8 (que são os primeiros 128 caracteres) para nomes de arquivos, para evitar exatamente esse tipo de problema.

Diferenças nas codificações de caracteres em nomes de arquivos podem causar problemas ao restaurar um backup TAR em um sistema com codificações diferentes.

De qualquer forma, você pode converter codificações com ICU:http://site.icu-project.org/.

HTH você fora-

Answer 1