Como salvar documentos do Word como HTML para serem visualizados no Firefox

Como salvar documentos do Word como HTML para serem visualizados no Firefox

Preciso salvar um documento do Word como HTML. Possui algumas imagens de fundo, outras imagens, textos, ... Ele abre corretamente no Internet Explorer, mas como posso salvar um documento do Word como HTML para que o Firefox e outros navegadores atuais o renderizem corretamente?

Todas as imagens estão faltando no documento. Examinei o documento HTML gerado, mas os caminhos para as imagens parecem estar corretos.

Qualquer ideia?

Coisas como "Não salve documentos como HTML" não serão úteis aqui.

Editar: Para deixar claro, o normal "Salvar como HTML" não funciona, o resultado é quebrado em qualquer navegador que não seja o Internet Explorer.

Edição 2: O que estou usando é o Word 2010 e o Firefox 4. Também tentei renderizá-lo na versão mais recente do Chrome, que também falhou. Usei diferentes configurações de compatibilidade para salvar como HTML, não ajudou

Responder1

Ao usar o Word Salvar como página da Web (htm html), antes de clicar em Salvar, observe o menu suspenso "Ferramentas" à esquerda do botão Salvar. Vá para este menu suspenso e clique em Opções da Web. Na caixa de opções que aparece, DESMARQUE a caixa "Confiar em VML..." Isso funcionou muito bem para mim. Boa sorte.

Responder2

Eu tenho um hack que envolve a modificação direta do código HTML. Estou usando o MS-Office 2007 e FF 10.0.4.

O truque é remover a <v:imagedata src = ...>sujeira que o Word gera quando você salva um arquivo em HTML e substituí-lo pelo arquivo <img src = ...>. O primeiro (imagedata ...) só pode ser renderizado pelo IE, enquanto o último é padrão e pode ser manipulado por todos os navegadores.

Exemplo:

Remova o seguinte -

<span style='mso-no-proof:yes'><v:shape id="Picture_x0020_2" o:spid="_x0000_i1026"
 type="#_x0000_t75" style='width:282.75pt;height:207.75pt;visibility:visible;
 mso-wrap-style:square'>
 <v:imagedata src="dcsl_overview_files/image006.png" o:title=""/>
</v:shape> </span>

Com:

<img src="dcsl_overview_files/image006.png" alt="overview figure">

Responder3

Eu encontrei o mesmo problema. Parece que, por alguns motivos, o Word exporta HTML normal para alguns documentos.

Normalmente o Word exporta gráficos com dois códigos: um especial para renderização no IE e um HTML normal para os demais navegadores.

O código se parece com o abaixo (removi grande parte do código para facilitar a leitura)

<p ...><span ...><!--[if gte vml 1]><v:shapetype...>
 [code for IE]
</v:shapetype>
<v:shape id="Picture_x0020_2" ... alt="...png" ...>
 <v:imagedata src="...docx_files/image001.png".../>
</v:shape><![endif]-->
<![if !vml]><img width=169 height=119
src="..."... ><![endif]></span></p>

Observe o condicional?

<!--[if gte vml 1]> IE Code <![endif]--> <![if !vml]> Non IE HTML <![endif]>

Para alguns documentos vejo que o Word deixa de ser bilíngue e exporta apenas a parte do IE.

Ainda não tenho a solução para esses casos. Ainda investigando

Responder4

Eu tentei apenas um documento simples, renderizado no Chrome, entãoYMMV- mas você tentou salvar como Web Page, Filtered(disponível na minha cópia do Word 2010, e presumo que em todas as versões).

Isso deve eliminar muitas das piores coisas, mas ainda assim, a saída pode nem sempre ser HTML perfeito e neutro para o navegador.

informação relacionada