Как структурировать фильтры jq для возврата информации о видео- и аудиокодеках из ffprobe?

Как структурировать фильтры jq для возврата информации о видео- и аудиокодеках из ffprobe?

В целях стандартизации моей видеотеки я пытаюсь найти способ быстро создать список файлов, которые необходимо преобразовать. После просмотраэтотвопрос и ответ на него (и много гугления) Я думаю, что я понял основы, но у меня возникли проблемы с подробным изложением раздела jq. Для справки, команда jq, с которой я начинаю, выглядит следующим образом:

jq -c '.format.filename as $path | 
    .streams[]? | 
    select(.codec_type=="video" and .codec_name!="h264") | 
    .codec_name as $vcodec | 
    {video: $vcodec, path: $path}'

и, для простоты, предположим, что это то, что передается в jq:

{
    "streams": [
        {
            "index": 0,
            "codec_name": "hevc",
            "codec_type": "video"
        },
        {
            "index": 1,
            "codec_name": "aac",
            "codec_type": "audio"
        }
    ],
    "format": {
        "filename": "Video.mkv"
    }
}

что дает следующий результат:

{"video":"hevc","path":"./Video.mkv"}

Это здорово, но я хочу пойти еще дальше - я бы также хотел включить кодек, используемый для любых аудиопотоков. Итак, учитывая тот же ввод, я хотел бы получить следующий вывод:

{"video":"hevc","audio":"aac","path":"./Video.mkv"}

Как мне этого добиться?

решение1

Чтобы выбрать типы аудио- и видеокодеков и исключить h264видео:

$ jq '.format.filename as $path |
    [.streams[]? | select(.codec_type=="audio" 
                          or (.codec_type=="video" 
                              and .codec_name!="h264")) | 
     {(.codec_type): .codec_name, $path}] | 
    group_by(.path) | map(add) | .[]' input.json
$ jq --version      
jq-1.5-1-a5b5cbe  

Если команда оболочки становится сложной и занимает больше нескольких строк, я переключаюсь на более подробный Python, чтобы справиться со сложностью:

result = dict(path=data['format']['filename'])
for stream in data['streams']:
    if (stream['codec_type'] == 'audio'
        or (stream['codec_type'] == 'video'
            and stream['codec_name'] != 'h264')):
        result[stream['codec_type']] = stream['codec_name'] # last value wins

data— это вход ( data = json.loads(json_text)), а result— это желаемый выход ( print(json.dumps(result))).

jqЕсли вы больше знакомы с императивным программированием на Python, чем с более функциональным стилем в , то адаптировать приведенный выше код для вашего конкретного случая будет относительно просто.

решение2

Вот еще один подход.

$ jq -M '
  def getpath: {path: .format.filename} ;
  def getcodecs: [
        .streams[]?
      | {(.codec_type):.codec_name}
      | if . == {"video":"h264"} then empty else . end
    ] | add
  ;
  getpath + getcodecs
  ' input.json

Выход

{
  "path": "Video.mkv",
  "video": "hevc",
  "audio": "aac"
}

Связанный контент