
Extraí o texto da legenda em.srt
formatar.
É essencialmente um texto com algumas palavras-chave que indicam que tipo de formatação aplicar às diferentes partes.
A formatação é derivada de tags HTML para negrito, itálico, sublinhado e cor:
Negrito – <b> ... </b>
ou{b} ... {/b}
Itálico – <i> ... </i>
ou{i} ... {/i}
Sublinhar – <u> ... </u>
ou{u} ... {/u}
Cor da fonte – <font color="color name or #code"> ... </font>
(como em HTML)
Agora, gostaria de convertê-lo para o formato LaTeX. Alguém sabe como fazer isso?
Obrigado.
EDIT: Aqui está um exemplo de dados:
37
00:03:28,544 --> 00:03:32,544
Maintenant une équation linéaire à deux inconnues
38
00:03:32,544 --> 00:03:36,544
est de la forme :
<i>c·aᵢ₁(α₁ - β₁) + c·aᵢ₂(α₂ - β₂) + ... + c·aₙ₁(αₙ - βₙ)) = 0.</i>,
39
00:03:37,841 --> 00:03:44,091
je nomme cette fois les inconnues <i>x</i> et <i>y</i>, où <i>a</i>, <i>b</i> et <i>c</i> sont des nombres réels.
Eu extraio o texto usandopysub2
Maintenant une équation linéaire à deux inconnues est de la forme :
<i>c·aᵢ₁(α₁ - β₁) + c·aᵢ₂(α₂ - β₂) + ... + c·aₙ₁(αₙ - βₙ)) = 0.</i>,
je nomme cette fois les inconnues <i>x</i> et <i>y</i>, où <i>a</i>,
<i>b</i> et <i>c</i> sont des nombres réels.
Eu gostaria de ter exatamente o mesmo texto no formato Latex, mas é claro, sem as tags de formatação (ou seja, etc.), mas com formatação Latex (por exemplo: \textit{c}
em vez de<i>c</i>