
Unas horas después de que subí unVídeo de YouTube codificado en FFmpeg, las pocas personas a las que se lo había enviado empezaron a reportar un problema extraño: que los primeros 26 minutos del audio sonaban muy distorsionados; algunos lo han descrito como si estuviera bajo el agua. Aquí estáun ejemplode cómo suena.
Luego comencé a realizar pruebas con más personas y obtuve los siguientes datos de un total de 31 dispositivos móviles.
Audio normal:
Galaxy S10 (x2)
Galaxy S20 (x3)
Galaxy A50
iPhone XR (x3)
iPhone 7
iPhone 8 (x2)
iPhone 10 Pro
iPhone 11
iPhone 11 Pro
iPhone 11 Pro Max
iPhone 12 (x3)
iPhone 12 Pro
Oppo F11
OnePlus 7T
Pixel 3A XL
OnePlus 7 Pro
Audio distorsionado:
iPhone 6S
Galaxy S7 Edge
Galaxy S8+
Galaxy S10 Lite
Huawei Y6 2019
Huawei P30 Pro
Honor 10 Lite
El audio de esos primeros 26 minutos se interrumpe en 7 de 31 dispositivos móviles, es decir, un 22%, y esto aumenta a más del 50% cuando solo se incluyen los teléfonos Android. La mayoría de los que pregunté se encontraban en países desarrollados, lo que significa que los datos también se inclinan hacia teléfonos más nuevos y modernos, lo que significa que esa cifra fácilmente podría estar más cerca del 80% en países menos desarrollados que utilizan principalmente Android más antiguos.
No hace falta decir que este es un problema bastante grande para alguien como yo que esperaba poder subir contenido a YouTube y dejar que él se encargara del resto en lugar de realizar una depuración de dispositivos similar a la de un desarrollador web.
Compilé el video a partir de varios videos fuente, codificándolos y concatenándolos usando FFmpeg.
Utiliza H264 y OPUS como códecs, pero lo más relevante es comprobar elvídeo fuentede donde provienen esos primeros 26 minutos muestra que este problema se origina en ese video, por lo que ahora la pregunta es:
a) ¿Qué hay en ese vídeo fuente en particular que está causando que el audio se vuelva confuso en una proporción tan grande de dispositivos móviles?
b) ¿Cómo puedo solucionarlo usando FFmpeg?
Respuesta1
No tengo idea de por qué se rechazó esto, pero de todos modos, logré encontrar una solución al problema publicando exactamente la misma pregunta en el foro de especialistas en audio de Doom9. Recibí la siguiente respuesta casi de inmediato del usuario.lvqcl:
Los canales izquierdo y derecho están desfasados 180°. Invierta uno de ellos (es decir, los primeros 26 minutos de uno de los canales).
Cuando le pregunté por qué el problema se limitaba a determinados dispositivos móviles, respondió:
Parece que reproducen audio en mono, por lo que suman los canales izquierdo y derecho. Por lo tanto, el resultado contiene sólo artefactos de compresión de audio de los canales izquierdo y derecho.
Luego comencé a buscar cómo solucionar este problema en FFmpeg y encontré el siguiente comando, cortesía de Gyanaquí:
ffmpeg -i input.wav -af "aeval='-val(0)':c=same" output.wav
Ejecutar este comando en el video fuente en cuestión, volver a concatenar todos los videos fuente, volver a subirlos a YouTube y luego probar nuevamente con los mismos dispositivos confirma que esto efectivamente ha solucionado el problema.
Me alegré de poder subir mi vídeo a YouTube sin preocuparme por la compatibilidad con dispositivos individuales, ya que me había ocupado de eso lo suficiente en mi trabajo de desarrollo web. Gracias a todos los que votaron para mantener abierta esta pregunta en contra de los deseos de los moderadores cada vez más entusiastas de este sitio.