
Estoy trabajando con el marco Smooks para Java y tengo un problema al cargar un documento de Word. El documento proviene de una fuente que no está en inglés y necesito averiguar cuál es la codificación de caracteres. ¿Existe algún lugar en Word 2010 que indique qué codificación utiliza el archivo?
Respuesta1
Los documentos de Word tienen un formato específico, que varía según la versión de Word. No existe una declaración de codificación de caracteres separada. Específicamente, Word 2010 utiliza un formato especial basado en XML, con codificación UTF-8 implícita.