
Estou trabalhando com o framework Smooks para Java e tendo um problema ao carregar um documento do Word. O documento é de uma fonte que não é o inglês e preciso descobrir qual é a codificação de caracteres. Existe algum lugar no Word 2010 que informa qual codificação o arquivo usa?
Responder1
Os documentos do Word possuem um formato específico, que varia de acordo com a versão do Word. Não há declaração de codificação de caracteres separada. Especificamente, o Word 2010 usa um formato especial baseado em XML, com codificação UTF-8 implícita.