Оптимальный аудиокодек и соответствующий формат/опция для записи голоса в малых и больших лекционных залах

Оптимальный аудиокодек и соответствующий формат/опция для записи голоса в малых и больших лекционных залах

OneNote от Microsoft, поставляемый с Office2010, отлично подходит для программного обеспечения для создания заметок. Он включает функцию записи аудио/видео или просто аудио. Параметры в программе для Codec: a) Windows media audio 9, b) windows media audio 9.2 и c) windows media audio 10 professional. Особенно в случае последнего Codec,многоДоступны форматы от <0kbps, 8kHz, mono CBR> до <320 kbps, 44kHz, stereo (A/V> CBR>. Похоже, они делятся на две категории: (A/V) и не-A/V (что бы это ни значило, я не знаю), а затем по кГц, а затем по кбит/с. Также добавлены опции для стерео, моно и того, что называется «низкой задержкой CBR».

Имея базовое понимание этих терминов, можно, вероятно, предположить, что 320kbps 48Khz CBR — это излишество для этой философии использования, а 0kbps 9 khz, mono CBR оставляет желать лучшего по качеству, особенно с жесткими дисками емкостью 1 ТБ, которые сейчас есть. Однако ответ на вопрос о том, какой именно формат лучше всего подходит для этой философии использования, — это еще один вопрос, который может потребовать иного уровня знаний, чем у большинства людей. Можно было бы использовать подход «попробуй и увидь», но этот вопрос, похоже, хорошо подходит суперпользователю, чтобы упустить возможность опубликовать.

Итак, мой вопрос: какая комбинация кодека/формата будет наиболее подходящей для философии использования записи аудио для заметок в большом или маленьком лекционном зале. Это может быть два вопроса; будет ли желателен определенный кодек в помещениях определенного размера?

ps подвопрос: Что в кодеке Windows Media Audio 10 Professional обозначает формат (A/V)?

решение1

  • Скорость передачи данныхнасколько хорошо звук может быть аппроксимирован заданным объемом данных. Слишком низкие битрейты приводят к искажению голоса, странным артефактам и неестественному, сглаженномупереходные процессы(коротко звучит как буква T). Более высокие битрейты будут лучше соответствовать исходному контенту, но потенциально бесполезны, если преимущества не будут четко слышны (излишество). Переменный битрейт всегда обеспечит лучшее качество, чем постоянный битрейт CBR при том же заданном битрейте, поскольку кодер концентрирует больше усилий (данных) на самых сложных для кодирования частях.

Давайте назовем битрейт:Целостность звука.

  • Частота дискретизациивлияет на возможный частотный спектр, который может иметь аудиофайл. Типичное значение составляет 44 кГц, поскольку оно практически охватывает весь слышимый диапазон (0-22 кГц). Уменьшая частоту дискретизации, вы отбрасываете более высокие частоты, которые больше не будут кодироваться, что упрощает кодирование того, что осталось, с лучшей целостностью. Однако уменьшение частоты дискретизации может изменить фоновый шум, который присутствует в большинстве записей, и это может привести к нежелательным побочным эффектам (более резкий шум), и в конечном итогешипениепроблемы (звуки "с") или просто безжизненность - даже при очень высоких битрейтах. Снижение частоты дискретизации может быть очень эффективным компромиссом при работе с очень низкими битрейтами; протоколы телефонии Voice over IP являются прекрасной демонстрацией этого.

Давайте назовем частоту дискретизацииБогатство звука.

  • Стерео: если ваш звук в основном моно, например речь, вы тратите половину полосы пропускания, кодируя его как стерео (если только это не объединенное стерео, но это уже другая история).

Что касается музыки, я думаю, общеизвестно, что 128kbps 44.1khz стерео с MP3 является переломным моментом, когда некоторое ухудшение музыки становится заметным практически для всех, хотя ее все еще можно слушать. Поскольку речь легче кодировать, чем музыку, я думаю, что ее моно эквивалент -MP3 64kbps 44.1khz - обеспечивает отличную отправную точку с достаточным качеством для большинства целей, не будучи при этом излишеством.

Наконец, Windows Media Audio призван быть намного более эффективным, чем MP3. Поэтому вы можете легко сместить эти контрольные точки на 25-40% (например, WMA 40kbps должен быть похож на MP3 64kbps). WMA Professionnal призван быть лучше, чем WMA 9, судя по всемусокращение количества вариантов кодирования с низким битрейтомчто WMA9 имеет и автоматически использует лучший метод для большинства контента. Так что если вам не нужно воспроизводить его на устройствах, которые поддерживают только WMA9, это, вероятно, лучший вариант.

Надеюсь, вы сможете двигаться дальше (или дальше).

Связанный контент