Создание скринкаста с помощью ffmpeg: как синхронизировать видео и аудио?

Создание скринкаста с помощью ffmpeg: как синхронизировать видео и аудио?

Я создал несколько скринкастов с помощью ffmpeg. ПК, который я использую, имеет подходящее оборудование (Intel Core i7-4930K Six Core 3.40GHz 12MB Cache, 32 GB RAM), но, к сожалению, он работает под управлением Windows 7. Поскольку я хочу сделать скринкаст на Linux, я установил Kubuntu в VMware. Я назначил 4 ядра ЦП и 4 GB RAM для виртуальной машины.

Я записываю свой скринкаст с помощью следующей команды:

ffmpeg -f alsa -ac 1 -i pulse -f x11grab -r 30 -s 1920x1080 -i :0.0 -acodec mp3 -vcodec libx264 -preset ultrafast -crf 0 -threads 0 output.mp4

Однако видео идет намного быстрее, чем звук. Через пару минут звук (записанный микрофоном) отстает на несколько секунд от видео. Я попытался записать звук на хосте Windows с помощью audacity параллельно, и звук из audacity и звук, захваченный ffmpeg в виртуальной машине, кажутся синхронизированными. Просто видео идет слишком быстро.

В чем причина? Может, это дело VMware? Есть ли какие-то настройки, которые я могу подкрутить? Есть ли опции ffmpeg, которые я могу использовать для синхронизации? Например, если бы я мог заставить ffmpeg отбрасывать или дублировать кадры, если аудио/видео не синхронизировано, это было бы для меня совершенно нормально, но, насколько я понимаю руководство по опции ffmpeg -vsync, это уже по умолчанию.

Я скомпилировал ffmpeg самостоятельно, следуяРуководство по компиляции Ubuntuи мне пришла в голову идея использовать ffmpegздесь.

EDIT: вывод ffmpeg по запросу:

$ /home/yankee/bin/ffmpeg -f alsa -ac 1 -i pulse -f x11grab -r 30 -s 1920x1080 -i :0.0 -acodec mp3 -vcodec libx264 -preset ultrafast -crf 0 -threads 0 05-visitor.mp4
ffmpeg version 2.1.git Copyright (c) 2000-2014 the FFmpeg developers
  built on Feb 24 2014 08:38:08 with gcc 4.8 (Ubuntu/Linaro 4.8.1-10ubuntu9)
  configuration: --prefix=/home/yankee/ffmpeg_build --extra-cflags=-I/home/yankee/ffmpeg_build/include --extra-ldflags=-L/home/yankee/ffmpeg_build/lib --bindir=/home/yankee/bin --extra-libs=-ldl --enable-gpl --enable-libass --enable-libfdk-aac --enable-libmp3lame --enable-libopus --enable-libtheora --enable-libvorbis --enable-libvpx --enable-libx264 --enable-nonfree --enable-x11grab
  libavutil      52. 65.100 / 52. 65.100
  libavcodec     55. 52.102 / 55. 52.102
  libavformat    55. 33.100 / 55. 33.100
  libavdevice    55. 10.100 / 55. 10.100
  libavfilter     4.  1.103 /  4.  1.103
  libswscale      2.  5.101 /  2.  5.101
  libswresample   0. 17.104 /  0. 17.104
  libpostproc    52.  3.100 / 52.  3.100
Guessed Channel Layout for  Input Stream #0.0 : mono
Input #0, alsa, from 'pulse':
  Duration: N/A, start: 1394106509.365291, bitrate: 768 kb/s
    Stream #0:0: Audio: pcm_s16le, 48000 Hz, mono, s16, 768 kb/s
[x11grab @ 0x2551e40] device: :0.0 -> display: :0.0 x: 0 y: 0 width: 1920 height: 1080
[x11grab @ 0x2551e40] shared memory extension found
Input #1, x11grab, from ':0.0':
  Duration: N/A, start: 1394106509.415547, bitrate: 1990656 kb/s
    Stream #1:0: Video: rawvideo (BGR[0] / 0x524742), bgr0, 1920x1080, 1990656 kb/s, 30 tbr, 1000k tbn, 30 tbc
No pixel format specified, yuv444p for H.264 encoding chosen.
Use -pix_fmt yuv420p for compatibility with outdated media players.                                                                                                                                                                                                            
[libx264 @ 0x256db60] using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX
[libx264 @ 0x256db60] profile High 4:4:4 Predictive, level 4.0, 4:4:4 8-bit
[libx264 @ 0x256db60] 64 - core 142 - H.264/MPEG-4 AVC codec - Copyleft 2003-2014 - http://www.videolan.org/x264.html - options: cabac=0 ref=1 deblock=0:0:0 analyse=0:0 me=dia subme=0 psy=0 mixed_ref=0 me_range=16 chroma_me=1 trellis=0 8x8dct=0 cqm=0 deadzone=21,11 fast_pskip=0 chroma_qp_offset=0 threads=6 lookahead_threads=1 sliced_threads=0 nr=0 decimate=1 interlaced=0 bluray_compat=0 constrained_intra=0 bframes=0 weightp=0 keyint=250 keyint_min=25 scenecut=0 intra_refresh=0 rc=cqp mbtree=0 qp=0
Output #0, mp4, to '05-visitor.mp4':
  Metadata:
    encoder         : Lavf55.33.100
    Stream #0:0: Video: h264 (libx264) ([33][0][0][0] / 0x0021), yuv444p, 1920x1080, q=-1--1, 15360 tbn, 30 tbc
    Stream #0:1: Audio: mp3 (libmp3lame) (i[0][0][0] / 0x0069), 48000 Hz, mono, s16p
Stream mapping:
  Stream #1:0 -> #0:0 (rawvideo -> libx264)
  Stream #0:0 -> #0:1 (pcm_s16le -> libmp3lame)
Press [q] to stop, [?] for help
frame=19011 fps= 30 q=-1.0 Lsize=  186418kB time=00:10:34.84 bitrate=2405.5kbits/s    
video:180861kB audio:4960kB subtitle:0 data:0 global headers:0kB muxing overhead 0.321432%
[libx264 @ 0x256db60] frame I:77    Avg QP: 0.00  size:451985
[libx264 @ 0x256db60] frame P:18934 Avg QP: 0.00  size:  7943
[libx264 @ 0x256db60] mb I  I16..4: 100.0%  0.0%  0.0%
[libx264 @ 0x256db60] mb P  I16..4: 59.7%  0.0%  0.0%  P16..4:  0.0%  0.0%  0.0%  0.0%  0.0%    skip:40.3%
[libx264 @ 0x256db60] coded y,u,v intra: 0.2% 0.2% 0.2% inter: 0.0% 0.0% 0.0%
[libx264 @ 0x256db60] i16 v,h,dc,p: 100%  0%  0%  0%
[libx264 @ 0x256db60] kb/s:2338.03

Я немного поигрался и заметил, что если выходной файл уже существует, ffmpeg спрашивает меня, хочу ли я перезаписать файл. В этом случае аудиопоток уже содержит то, что я сказал, в то время как вопрос о перезаписи файла существует. Однако видео не начинается до тех пор, пока я не подтвержу перезапись файла, и поэтому звук, естественно, довольно сильно отстает от видео. Но с этим легко справиться. Просто не перезаписывайте существующие файлы.

Мне не важен конечный формат, главное, чтобы видео было в формате без потерь и я мог редактировать его в Adobe Premiere (он не поддерживает mkv).

EDIT2: Я немного приблизился к проблеме. Если очень внимательно посмотреть на полученный видеопоток, то иногда можно заметить, что пара кадров отсутствует. Может быть, потому что я открыл окно как раз в этот момент, что заставляет сжатие видео потреблять больше ресурсов ЦП (из-за изменения многих пикселей) или что-то в этом роде. Может быть, есть какие-то буферы, которые я могу назначить ffmpeg, чтобы ускорить обработку в такие моменты? В конце концов, у моей машины 32 ГБ ОЗУ, это должно быть хорошо для чего-то... Или есть какие-то другие кодеки без потерь, которые я мог бы использовать или...? В следующий раз я также попробую установить более высокий приоритет ЦП для ffmpeg.

решение1

Это работает для меня в 2019 году. Я пробовал с разными кодировщиками, но при использовании тех, которые не подходят nativeдля ffmpeg, аудио и видео рассинхронизируются. В частности, видео отстает . mpeg4и .aacnative

ffmpeg -f alsa -ac 1 -i pulse -f x11grab -r 30 -s 1920x1080  -i :0.0 -acodec aac -vcodec mpeg4 -preset medium -qscale:v 5 rec.mkv

решение2

Я получаю сообщение "[swscaler @ 0xa314080] Предупреждение: данные не выровнены! Это может привести к потере скорости", которое, похоже, является проблемой. Однако у меня пока нет решения.

Связанный контент