WAV 스트림에 대한 ffprobe 출력 해석

WAV 스트림에 대한 ffprobe 출력 해석

tl;dr: 무슨 ([1][0][0][0] / 0x0001)뜻인가요?


ffprobe test.wav다음을 생산합니다:

ffprobe version 3.3.3 Copyright (c) 2007-2017 the FFmpeg developers
  built with gcc 4.8 (Ubuntu 4.8.4-2ubuntu1~14.04.3)
  configuration: --extra-libs=-ldl --prefix=/opt/ffmpeg --mandir=/usr/share/man --enable-avresample --disable-debug --enable-nonfree --enable-gpl --enable-version3 --enable-libopencore-amrnb --enable-libopencore-amrwb --disable-decoder=amrnb --disable-decoder=amrwb --enable-libpulse --enable-libfreetype --enable-gnutls --disable-ffserver --enable-libx264 --enable-libx265 --enable-libfdk-aac --enable-libvorbis --enable-libtheora --enable-libmp3lame --enable-libopus --enable-libvpx --enable-libspeex --enable-libass --enable-avisynth --enable-libsoxr --enable-libxvid --enable-libvidstab --enable-libwavpack --enable-nvenc --enable-libzimg
  libavutil      55. 58.100 / 55. 58.100
  libavcodec     57. 89.100 / 57. 89.100
  libavformat    57. 71.100 / 57. 71.100
  libavdevice    57.  6.100 / 57.  6.100
  libavfilter     6. 82.100 /  6. 82.100
  libavresample   3.  5.  0 /  3.  5.  0
  libswscale      4.  6.100 /  4.  6.100
  libswresample   2.  7.100 /  2.  7.100
  libpostproc    54.  5.100 / 54.  5.100
Input #0, wav, from 'test.wav':
  Metadata:
    encoder         : Lavf57.71.100
  Duration: 00:00:10.00, bitrate: 1536 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 48000 Hz, 2 channels, s16, 1536 kb/s

오디오 스트림을 어떻게 해석합니까? 이것이 내가 지금까지 이해한 것입니다:

  • Stream #0:0: 첫 번째 스트림
  • Audio: 별로 놀랄 일도 아닌데...
  • pcm_s16le: 펄스 코딩 변조(Pulse Coded Modulation), 여기서 각 샘플은 부호 있는 16비트 리틀 엔디안 정수입니다.
  • ([1][0][0][0] / 0x0001): ???
  • 48000 Hz: 샘플링 속도
  • 2 channels스테레오
  • s16: 다시 부호 있는 16비트 정수인가요?
  • 1536 kb/s: 데이터 속도

답변1

에서는 코덱 태그이고 해당 ([1][0][0][0] / 0x0001)태그 에서 파생된 문자열입니다. 태그가 인쇄 가능한 문자로 인코딩된 경우 문자열에는 해당 문자가 포함됩니다.0x0001[1][0][0][0]

0x6134706d--> mp4a여기서 (16진수) 6d == 'm', 70 == 'p', 34 == '4' 및 61 == 'a'입니다.

PCM_S16LE에는 0x0001 태그가 있습니다.

s16인터리브된 16비트 부호가 있습니다. 즉, 스테레오 스트림의 경우 디코더는 {채널 1의 샘플, 채널 2의 샘플, 채널 1의 샘플...}을 전송합니다. 다른 옵션은 s16p평면형입니다.

관련 정보