![Convertendo arquivos rtfd para txt, sem excluir hiperlinks e imagens no OS X](https://rvso.com/image/1303463/Convertendo%20arquivos%20rtfd%20para%20txt%2C%20sem%20excluir%20hiperlinks%20e%20imagens%20no%20OS%20X.png)
Eu tenhobastante(>10k ... isso não pode ser feito manualmente) de arquivos rtf e rtfd que gostaria de transformar em arquivos txt. Infelizmente eles contêm fotos e hiperlinks que não quero perder. Idealmente, eu gostaria de:
ter hiperlinks do rtf/rtfd armazenados como texto simples (algo como
[[description]link]
)tenha todas as imagens "separadas" do arquivo rtfd
tenha o novo txt com URLs, bem como as imagens do arquivo rtf/rtfd salvos juntos em uma pasta com o nome do arquivo rtf/rtfd antigo.
Como isso pode ser feito?
Responder1
.rtfd
são apenas pacotes de um TXT.rtf
arquivo com instruções de formatação não padrão e as imagens. Então você já tem estes e o arquivo RTF separados.
Os arquivos RTF são apenas texto com algumas instruções de formatação, semelhantes ao HTML. Portanto, você pode usar substituições de strings baseadas em texto simples.
Uma imagem incorporada fica assim no meu documento de exemplo:
{{\NeXTGraphic Screen Shot 2012-02-01 at 19.47.21.png \width13940 \height11020
}¬}
No arquivo RTF, altere todas as ocorrências \NeXTGraphic
para algo como "Imagem:"; a outra formatação será simplesmente ignorada quando você abri-la na próxima vez (pelo menos em meus testes limitados).
Um hiperlink incorporado tem esta aparência:
{\field{\*\fldinst{HYPERLINK "http://superuser.com/questions/384862/osx-converting-rtfd-files-to-txt-without-deleting-hyperlinks-and-pictures"}}{\fldrslt applescript - OSX: Converting rtfd files to txt, without deleting hyperlinks and pictures - Super User}}\
\
}
Novamente, uma substituição de texto bastante simples que você pode fazer na maioria dos editores de sua escolha ou, por exemplo, usando sed
a linha de comando. fldinst
é o URL do hiperlink subjacente, fldrslt
é o rótulo.
Depois de substituir todas as imagens e hiperlinks por alternativas compatíveis com texto simples, você pode simplesmente executar textutil -convert txt Document.rtfd/TXT.rtf
para converter o arquivo RTF em texto simples.
Se você não tivesse feito as substituições das imagens incorporadas e dos hiperlinks com antecedência, eles teriam sido perdidos.
Claro, textutil
pode converter para HTML e arquivos de imagem sem perder informações. Se você se sentir mais confortável criando scripts para as substituições de tags HTML, poderá fazer isso primeiro.