解釋 WAV 流的 ffprobe 輸出

解釋 WAV 流的 ffprobe 輸出

tl;dr: 是什麼([1][0][0][0] / 0x0001)意思?


ffprobe test.wav產生:

ffprobe version 3.3.3 Copyright (c) 2007-2017 the FFmpeg developers
  built with gcc 4.8 (Ubuntu 4.8.4-2ubuntu1~14.04.3)
  configuration: --extra-libs=-ldl --prefix=/opt/ffmpeg --mandir=/usr/share/man --enable-avresample --disable-debug --enable-nonfree --enable-gpl --enable-version3 --enable-libopencore-amrnb --enable-libopencore-amrwb --disable-decoder=amrnb --disable-decoder=amrwb --enable-libpulse --enable-libfreetype --enable-gnutls --disable-ffserver --enable-libx264 --enable-libx265 --enable-libfdk-aac --enable-libvorbis --enable-libtheora --enable-libmp3lame --enable-libopus --enable-libvpx --enable-libspeex --enable-libass --enable-avisynth --enable-libsoxr --enable-libxvid --enable-libvidstab --enable-libwavpack --enable-nvenc --enable-libzimg
  libavutil      55. 58.100 / 55. 58.100
  libavcodec     57. 89.100 / 57. 89.100
  libavformat    57. 71.100 / 57. 71.100
  libavdevice    57.  6.100 / 57.  6.100
  libavfilter     6. 82.100 /  6. 82.100
  libavresample   3.  5.  0 /  3.  5.  0
  libswscale      4.  6.100 /  4.  6.100
  libswresample   2.  7.100 /  2.  7.100
  libpostproc    54.  5.100 / 54.  5.100
Input #0, wav, from 'test.wav':
  Metadata:
    encoder         : Lavf57.71.100
  Duration: 00:00:10.00, bitrate: 1536 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 48000 Hz, 2 channels, s16, 1536 kb/s

如何解釋音頻串流?到目前為止我的理解是這樣的:

  • Stream #0:0: 第一個流
  • Audio: 沒什麼奇怪的...
  • pcm_s16le:脈衝編碼調變,其中每個樣本都是有符號的 16 位元小端整數
  • ([1][0][0][0] / 0x0001): ???
  • 48000 Hz:取樣率
  • 2 channels立體聲
  • s16: 再次對16位元整數進行簽章?
  • 1536 kb/s:數據速率

答案1

在 中([1][0][0][0] / 0x0001)0x0001是編解碼器標籤,並且[1][0][0][0]是從該標籤派生的字串。如果標籤編碼可列印字符,則字串將包含這些字符,即

0x6134706d-->mp4a其中(十六進位)6d == 'm'、70 == 'p'、34 == '4' 和 61 == 'a'。

PCM_S16LE 的標籤為 0x0001。

s16是帶符號的 16 位元、交錯的,即對於立體聲流,解碼器將發送{通道 1 的樣本、通道 2 的樣本、通道 1 的樣本...}。另一個選項是s16p,它是平面的。

相關內容