
Necesito guardar un documento de Word como HTML. Tiene algunas imágenes de fondo, otras imágenes, textos,... Se abre correctamente en Internet Explorer, pero ¿cómo puedo guardar un documento de Word como HTML para que Firefox y otros navegadores actuales lo representen correctamente?
Faltan todas las imágenes en el documento. Revisé el documento html generado, pero las rutas de las imágenes parecen ser correctas.
¿Alguna idea?
Cosas como "No guardar documentos como html" no serán útiles aquí.
Editar: Para que quede claro, el "Guardar como HTML" normal no es suficiente, el resultado no funciona en cualquier navegador que no sea Internet Explorer.
Edición 2: lo que estoy usando es Word 2010 y Firefox 4. También intenté renderizarlo en la última versión de Chrome, que también falló. Utilicé diferentes configuraciones de compatibilidad para guardar como html, no ayudó
Respuesta1
Cuando utilice Guardar como página web de Word (htm html), justo antes de hacer clic en Guardar, observe el menú desplegable "Herramientas" a la izquierda del botón Guardar. Vaya a este menú desplegable, haga clic en Opciones web. En el cuadro de opciones que aparece, DESMARQUE la casilla denominada "Confiar en VML..." Esto funcionó muy bien para mí. Buena suerte.
Respuesta2
Tengo un truco que implica modificar el código HTML directamente. Estoy usando MS-Office 2007 y FF 10.0.4.
El truco consiste en eliminar la <v:imagedata src = ...>
basura que genera Word cuando guarda un archivo en HTML y reemplazarlo con el estándar <img src = ...>
. El primero (imagedata...) sólo puede ser renderizado por IE, mientras que el segundo es estándar y puede ser manejado por todos los navegadores.
Ejemplo:
Elimine lo siguiente:
<span style='mso-no-proof:yes'><v:shape id="Picture_x0020_2" o:spid="_x0000_i1026"
type="#_x0000_t75" style='width:282.75pt;height:207.75pt;visibility:visible;
mso-wrap-style:square'>
<v:imagedata src="dcsl_overview_files/image006.png" o:title=""/>
</v:shape> </span>
Con:
<img src="dcsl_overview_files/image006.png" alt="overview figure">
Respuesta3
Encontré el mismo problema. Parece que por alguna razón Word exporta HTML normal para algunos documentos.
Normalmente Word exporta gráficos con dos códigos: uno especial para renderizar en IE y HTML normal para otros navegadores.
El código se ve a continuación (eliminé gran parte del código para facilitar la lectura)
<p ...><span ...><!--[if gte vml 1]><v:shapetype...>
[code for IE]
</v:shapetype>
<v:shape id="Picture_x0020_2" ... alt="...png" ...>
<v:imagedata src="...docx_files/image001.png".../>
</v:shape><![endif]-->
<![if !vml]><img width=169 height=119
src="..."... ><![endif]></span></p>
¿Notas el condicional?
<!--[if gte vml 1]> IE Code <![endif]--> <![if !vml]> Non IE HTML <![endif]>
Para algunos documentos veo que Word deja de ser bilingüe y exporta solo la parte de IE.
Aún no tengo la solución para estos casos. Todavía investigando
Respuesta4
Solo probé un documento simple, renderizado en Chrome, así queYMMV- pero ¿ha intentado guardar como Web Page, Filtered
(disponible en mi copia de Word 2010 y supongo que en todas las versiones)?
Esto debería eliminar muchas de las peores cosas, pero aun así, es posible que el resultado no siempre sea un HTML perfecto y neutral para el navegador.