
我正在使用 Java 的 Smooks 框架,但在載入 Word 文件時遇到問題。該文件來自非英語來源,我需要弄清楚字元編碼是什麼。 Word 2010 是否有地方告訴您文件使用什麼編碼?
答案1
Word 文件具有特定的格式,該格式因 Word 版本而異。沒有單獨的字元編碼聲明。具體來說,Word 2010 使用基於 XML 的特殊格式,並隱含 UTF-8 編碼。
我正在使用 Java 的 Smooks 框架,但在載入 Word 文件時遇到問題。該文件來自非英語來源,我需要弄清楚字元編碼是什麼。 Word 2010 是否有地方告訴您文件使用什麼編碼?
Word 文件具有特定的格式,該格式因 Word 版本而異。沒有單獨的字元編碼聲明。具體來說,Word 2010 使用基於 XML 的特殊格式,並隱含 UTF-8 編碼。