lendo um documento antigo do MSWord/preservação de dados

lendo um documento antigo do MSWord/preservação de dados

Tenho um documento antigo do MS Word de c.1997 que gostaria de converter/renderizar corretamente. O OpenOffice abrirá o documento, mas os caracteres acentuados não serão renderizados. Caso contrário, parece correto. Eu gostaria de renderizá-lo com esses caracteres e convertê-lo para um formato que (espero) não se deteriore assim no futuro. A formatação do documento é importante. Manter a capacidade de editar o documento no futuro é desejável, mas secundário em relação à preservação deste documento.

Não executo mais o Windows e não tenho mais certeza se tenho mais uma cópia do Microsoft Office disponível; Atualmente estou executando o Fedora 13. Considero o documento sensível, portanto, qualquer solução que exija upload ou compartilhamento do documento não é aceitável.

Estou pensando que pode haver uma maneira de determinar as fontes usadas e uma fonte correspondente disponível e, em seguida, fazer algum tipo de operação de pesquisa e substituição em massa no documento. Ou alguma coisa? E para qual formato devo convertê-lo no futuro?

Responder1

A compatibilidade do OpenOffice é assustadoramente ruim. Antes de mais nada, você vai querer fazer algumas duplicatas para brincar. Se você tiver outra cópia, não use a versão que OO.o abriu. Isso mostra o quão ruim é a compatibilidade.

Mesmo que você não viva com o Windows, certamente encontrará uma cópia na biblioteca local. Traga o arquivo lá e veja o que pode ser feito.

Você também pode comprar o Office 2000 no eBay e executá-lo no Wine (o Office 2k funciona extraordinariamente bem no Wine) e ver se funciona.

Para preservação de dados, parece que há várias opções. A Microsoft está impulsionando muito o DOCX e, tecnicamente, é impressionante como ele pode durar. É apenas um arquivo zip renomeado, então se o MS quebrar, você pode simplesmente renomear o arquivo para .zip, abri-lo e retirar todos os recursos. O conteúdo real deles é escrito em XML, que também é um padrão bastante à prova de futuro. E porque um arquivo zip mantém as informações do arquivo no final do arquivo .zip, o que a MS afirma torná-lo mais à prova de corrupção.

Se você não confia no DOCX, então você tem RTF, HTML e LaTeX (se souber) como opções.

Responder2

TentarConversor Doc-XouZamzar(pop-ups); aplicativos online que convertem todos os tipos de documentos em vários formatos.

Responder3

informação relacionada