Onde encontro a codificação de caracteres de um documento do Word?

Onde encontro a codificação de caracteres de um documento do Word?

Estou trabalhando com o framework Smooks para Java e tendo um problema ao carregar um documento do Word. O documento é de uma fonte que não é o inglês e preciso descobrir qual é a codificação de caracteres. Existe algum lugar no Word 2010 que informa qual codificação o arquivo usa?

Responder1

Os documentos do Word possuem um formato específico, que varia de acordo com a versão do Word. Não há declaração de codificação de caracteres separada. Especificamente, o Word 2010 usa um formato especial baseado em XML, com codificação UTF-8 implícita.

informação relacionada