
Я работаю с фреймворком Smooks для Java и столкнулся с проблемой при загрузке документа Word. Документ не из английского источника, и мне нужно выяснить, какая кодировка символов. Есть ли в Word 2010 место, где указано, какую кодировку использует файл?
решение1
Документы Word имеют определенный формат, который зависит от версии Word. Отдельной декларации кодировки символов нет. В частности, Word 2010 использует специальный формат на основе XML с подразумеваемой кодировкой UTF-8.