
tl;dr: どういう([1][0][0][0] / 0x0001)
意味ですか?
ffprobe test.wav
生成:
ffprobe version 3.3.3 Copyright (c) 2007-2017 the FFmpeg developers
built with gcc 4.8 (Ubuntu 4.8.4-2ubuntu1~14.04.3)
configuration: --extra-libs=-ldl --prefix=/opt/ffmpeg --mandir=/usr/share/man --enable-avresample --disable-debug --enable-nonfree --enable-gpl --enable-version3 --enable-libopencore-amrnb --enable-libopencore-amrwb --disable-decoder=amrnb --disable-decoder=amrwb --enable-libpulse --enable-libfreetype --enable-gnutls --disable-ffserver --enable-libx264 --enable-libx265 --enable-libfdk-aac --enable-libvorbis --enable-libtheora --enable-libmp3lame --enable-libopus --enable-libvpx --enable-libspeex --enable-libass --enable-avisynth --enable-libsoxr --enable-libxvid --enable-libvidstab --enable-libwavpack --enable-nvenc --enable-libzimg
libavutil 55. 58.100 / 55. 58.100
libavcodec 57. 89.100 / 57. 89.100
libavformat 57. 71.100 / 57. 71.100
libavdevice 57. 6.100 / 57. 6.100
libavfilter 6. 82.100 / 6. 82.100
libavresample 3. 5. 0 / 3. 5. 0
libswscale 4. 6.100 / 4. 6.100
libswresample 2. 7.100 / 2. 7.100
libpostproc 54. 5.100 / 54. 5.100
Input #0, wav, from 'test.wav':
Metadata:
encoder : Lavf57.71.100
Duration: 00:00:10.00, bitrate: 1536 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 48000 Hz, 2 channels, s16, 1536 kb/s
オーディオ ストリームをどのように解釈すればよいでしょうか? これまでのところ、次のことが理解できました。
Stream #0:0
: 最初のストリームAudio
: 驚くことではありません...pcm_s16le
: パルス符号化変調。各サンプルは符号付き16ビットのリトルエンディアン整数である。([1][0][0][0] / 0x0001)
: ???48000 Hz
: サンプルレート2 channels
ステレオs16
: また符号付き16ビット整数ですか?1536 kb/s
: データレート
答え1
では([1][0][0][0] / 0x0001)
、0x0001
はコーデックタグであり、は[1][0][0][0]
タグから派生した文字列です。タグが印刷可能な文字をエンコードしている場合、文字列にはそれらの文字が含まれます。
0x6134706d
-->mp4a
ここで (16 進数) 6d == 'm'、70 == 'p'、34 == '4'、61 == 'a' です。
PCM_S16LEのタグは0x0001です。
s16
は符号付き 16 ビット、インターリーブです。つまり、ステレオ ストリームの場合、デコーダーは {チャンネル 1 のサンプル、チャンネル 2 のサンプル、チャンネル 1 のサンプル...} を送信します。もう 1 つのオプションはs16p
、平面の です。