SRTテキストをLaTeXへ

SRTテキストをLaTeXへ

字幕テキストを抽出しました.srtフォーマット

本質的には、さまざまな部分にどのタイプの書式を適用するかを示すいくつかのキーワードを含むテキストです。

書式設定は、太字、斜体、下線、色の HTML タグから派生します。

太字 –<b> ... </b>または{b} ... {/b}

斜体 –<i> ... </i>または{i} ... {/i}

下線 –<u> ... </u>または{u} ... {/u}

フォントの色 – <font color="color name or #code"> ... </font>(HTML の場合)

さて、これを LaTeX 形式に変換したいと思います。その方法を誰か知っていますか?

ありがとう。

編集: サンプルデータは次のとおりです:

37
00:03:28,544 --> 00:03:32,544
Maintenant une équation linéaire à deux inconnues

38
00:03:32,544 --> 00:03:36,544
est de la forme : 
<i>c·aᵢ₁(α₁ - β₁) + c·aᵢ₂(α₂ - β₂) + ... + c·aₙ₁(αₙ - βₙ)) = 0.</i>,

39
00:03:37,841 --> 00:03:44,091
je nomme cette fois les inconnues <i>x</i> et <i>y</i>, où <i>a</i>, <i>b</i> et <i>c</i> sont des nombres réels.

私はテキストを抽出しますpysub2

Maintenant une équation linéaire à deux inconnues est de la forme :

<i>c·aᵢ₁(α₁ - β₁) + c·aᵢ₂(α₂ - β₂) + ... + c·aₙ₁(αₙ - βₙ)) = 0.</i>, 

je nomme cette fois les inconnues <i>x</i> et <i>y</i>, où <i>a</i>, 
<i>b</i> et <i>c</i> sont des nombres réels.

私はまったく同じテキストをLaTeX形式で取得したいのですが、もちろん、書式タグ(ieなど)は使用せず、LaTeXの書式設定(たとえば\textit{c}<i>c</i>

関連情報