Convertir archivos rtfd a txt, sin eliminar hipervínculos e imágenes en OS X

Convertir archivos rtfd a txt, sin eliminar hipervínculos e imágenes en OS X

Tengomucho(>10k... esto no se puede hacer manualmente) de archivos rtf y rtfd que me gustaría convertir en archivos txt. Lamentablemente contienen imágenes e hipervínculos que no quiero perder. Idealmente, me gustaría:

  1. tener hipervínculos del rtf/rtfd almacenados como texto sin formato (algo así como [[description]link])

  2. tener todas las imágenes "separadas" del archivo rtfd

  3. guarde el nuevo texto con las URL y las imágenes del archivo rtf/rtfd juntos en una carpeta con el nombre del archivo rtf/rtfd antiguo.

¿Cómo se puede hacer esto?

Respuesta1

.rtfdson solo paquetes de un TXT.rtfarchivo con instrucciones de formato no estándar y las imágenes. Así que ya los tienes separados del archivo RTF.

Los archivos RTF son solo texto con algunas instrucciones de formato, similares a HTML. Por lo tanto, puede utilizar reemplazos de cadenas simples basados ​​en texto.

Una imagen incrustada se ve así en mi documento de muestra:

{{\NeXTGraphic Screen Shot 2012-02-01 at 19.47.21.png \width13940 \height11020
}¬}

En el archivo RTF, cambie todas las apariciones de \NeXTGraphica algo como "Imagen:"; el otro formato simplemente se ignorará cuando lo abras la próxima vez (al menos en mis pruebas limitadas).

Un hipervínculo incrustado tiene este aspecto:

{\field{\*\fldinst{HYPERLINK "http://superuser.com/questions/384862/osx-converting-rtfd-files-to-txt-without-deleting-hyperlinks-and-pictures"}}{\fldrslt applescript - OSX: Converting rtfd files to txt, without deleting hyperlinks and pictures - Super User}}\
\
}

Nuevamente, un reemplazo de texto bastante simple que puede realizar en la mayoría de los editores de su elección o, por ejemplo, usando sedla línea de comando. fldinstes la URL del hipervínculo subyacente, fldrsltes la etiqueta.


Una vez que haya reemplazado todas las imágenes e hipervínculos por alternativas compatibles con texto sin formato, simplemente puede ejecutar textutil -convert txt Document.rtfd/TXT.rtfpara convertir el archivo RTF a texto sin formato.

Si no hubiera realizado los reemplazos de las imágenes incrustadas y los hipervínculos de antemano, estos se habrían perdido.


Por supuesto, textutilpuedes convertir a HTML y archivos de imagen sin perder información. Si se siente más cómodo creando secuencias de comandos para reemplazar etiquetas HTML, puede hacerlo primero.

información relacionada