텍스트를 라텍스로 Srt

텍스트를 라텍스로 Srt

자막 텍스트를 추출했습니다.srt체재.

이는 본질적으로 다른 부분에 적용할 형식 지정 유형을 나타내는 일부 키워드가 포함된 텍스트입니다.

서식은 굵게, 기울임꼴, 밑줄 및 색상에 대한 HTML 태그에서 파생됩니다.

굵게 - <b> ... </b>또는{b} ... {/b}

이탤릭체 - <i> ... </i>또는{i} ... {/i}

밑줄 - <u> ... </u>또는{u} ... {/u}

글꼴 색상 - <font color="color name or #code"> ... </font>(HTML과 동일)

이제 LaTeX 형식으로 변환하고 싶습니다. 이 작업을 수행하는 방법을 아는 사람이 있습니까?

감사해요.

편집: 다음은 샘플 데이터입니다.

37
00:03:28,544 --> 00:03:32,544
Maintenant une équation linéaire à deux inconnues

38
00:03:32,544 --> 00:03:36,544
est de la forme : 
<i>c·aᵢ₁(α₁ - β₁) + c·aᵢ₂(α₂ - β₂) + ... + c·aₙ₁(αₙ - βₙ)) = 0.</i>,

39
00:03:37,841 --> 00:03:44,091
je nomme cette fois les inconnues <i>x</i> et <i>y</i>, où <i>a</i>, <i>b</i> et <i>c</i> sont des nombres réels.

나는 다음을 사용하여 텍스트를 추출합니다.pysub2

Maintenant une équation linéaire à deux inconnues est de la forme :

<i>c·aᵢ₁(α₁ - β₁) + c·aᵢ₂(α₂ - β₂) + ... + c·aₙ₁(αₙ - βₙ)) = 0.</i>, 

je nomme cette fois les inconnues <i>x</i> et <i>y</i>, où <i>a</i>, 
<i>b</i> et <i>c</i> sont des nombres réels.

나는 Latex 형식에서 정확히 동일한 텍스트를 갖고 싶지만 물론 서식 태그(예: 등)는 없지만 Latex 서식(예: \textit{c}대신<i>c</i>

관련 정보