Codificación de MS Word (después de la conversión)

Codificación de MS Word (después de la conversión)

Tengo un par de documentos de MS Word que quiero limpiar pero no sé qué significa toda la codificación. Me pregunto si hay una lista en algún lugar para no tener que copiar y pegar todos los ejemplos.

He aquí parte del problema:

åThis åis åthe France of åwinding åmountainðroads, ååsmall åcottages åwith åred åbrick-tile åroofs, åandðhillside ågardens. åThe åview åfrom the åtrain åincludes åaðcathedral åwith proportions and general characteristics thatðmatch åthe åone åin Cologne, åalthough its åactual åsize åisðproportional åto

Esto está en Word ('97), pero estoy bastante seguro de que es una conversión de una versión anterior de Word o posiblemente una conversión de un programa de base de datos muy antiguo de los años 90.

Descubrí parte de la codificación del contexto (ya corregida/eliminada):

  • ä es un espacio
  • ï es un salto de línea

pero hay varios otros que no puedo descifrar, como los del ejemplo anterior (å, ð, etc.), y ñy un cuadrado (que no se puede copiar aquí). Algunos probablemente podría eliminarlos , pero prefiero saber qué significan los símbolos, por si acaso.

¿Alguien conoce una lista de estilos o formatos de reemplazo que se aplicarían a estos personajes?

información relacionada