
我正在刻錄字幕並提取幀,我想為每個包含字幕的提取幀生成帶有字幕的文本文件,所有這些都在 ffmpeg 內(或者可能修改源代碼)。
我的第一次嘗試是一個腳本,透過使用基於提取的幀編號和提取的幀速率的公式檢索時間,並在字幕檔案中查找相應的時間,將幀編號映射到字幕。不幸的是,這並不能提供 100% 的準確度,所以現在我正在尋找直接在 ffmpeg 中完成此操作的方法。
我查看了原始程式碼,它相對複雜,我找不到一種方法來捕捉我知道我正在提取帶有字幕的幀的時刻。
是否可以在 ffmpeg 中實現這一目標而不觸及原始程式碼?否則,有人可以幫我找到原始碼的相關部分嗎?
謝謝