Optimaler Audio-Codec und entsprechendes Format/Option für die Sprachaufzeichnung in kleinen und großen Hörsälen

Optimaler Audio-Codec und entsprechendes Format/Option für die Sprachaufzeichnung in kleinen und großen Hörsälen

Microsoft OneNote, das mit Office2010 geliefert wird, eignet sich sehr gut als Notizsoftware. Es enthält die Funktion, Audio/Video oder nur Audio aufzunehmen. Die Optionen im Programm für Codec sind a) Windows Media Audio 9, b) Windows Media Audio 9.2 und c) Windows Media Audio 10 Professional. Insbesondere im Fall des letztgenannten CodecsvieleFormate sind verfügbar, von <0 kbps, 8 kHz, Mono-CBR> bis <320 kbps, 44 kHz, Stereo (A/V> CBR>. Sie scheinen in zwei Kategorien unterteilt zu sein: (A/V) und Nicht-A/V (was das bedeutet, weiß ich nicht), und dann nach ihren kHz und dann ab kbps. Hinzu kommen auch Optionen für Stereo, Mono und das sogenannte „Low Delay CBR“.

Mit einem grundlegenden Verständnis dieser Begriffe könnte man wahrscheinlich vermuten, dass 320 kbps 48 kHz CBR für diese Nutzungsphilosophie übertrieben ist und 0 kbps 9 kHz, Mono-CBR in Bezug auf die Qualität zu wünschen übrig lässt, insbesondere bei den heutzutage verfügbaren 1-TB-Festplatten. Die Beantwortung der Frage, welches Format sich am besten für diese Nutzungsphilosophie eignet, ist jedoch eine andere Frage, die möglicherweise ein anderes Wissensniveau erfordert, als die meisten Leute haben. Man könnte den Versuch-und-schau-Ansatz wählen, aber diese Frage scheint zu gut für Superuser geeignet zu sein, um die Gelegenheit zum Posten zu verpassen.

Meine Frage ist also: Welche Codec/Format-Kombination wäre für die Philosophie der Audioaufzeichnung für Notizen in einem großen oder kleinen Hörsaal am besten geeignet? Das könnten zwei Fragen sein: Wäre ein bestimmter Codec in Räumen bestimmter Größe wünschenswert?

ps Nebenfrage: Was bezeichnet im Windows Media Audio 10 Professional Codec das Format (A/V)?

Antwort1

  • Bitrateist, wie gut der Ton mit einer bestimmten Datenmenge angenähert werden kann. Zu niedrige Bitraten führen zu verzerrter Stimme, seltsamen Artefakten und unnatürlichen, geglättetenTransienten(kurze Laute wie der Buchstabe T). Höhere Bitraten entsprechen dem Originalinhalt besser, sind aber möglicherweise nutzlos, wenn die Vorteile nicht deutlich hörbar sind (Overkill). Variable Bitraten bieten bei gleicher Bitrate immer eine bessere Qualität als CBR mit konstanter Bitrate, da der Encoder dann mehr Aufwand (Daten) auf die am schwierigsten zu codierenden Teile konzentriert.

Nennen wir die Bitrate:Audiointegrität.

  • Beispielratebeeinflusst das mögliche Frequenzspektrum einer Audiodatei. Der typische Wert ist 44 kHz, da er praktisch den gesamten hörbaren Bereich (0-22 kHz) abdeckt. Durch die Reduzierung der Abtastrate werden höhere Frequenzen gelöscht, die nicht mehr codiert werden, wodurch es einfacher wird, das übrige Material mit besserer Integrität zu codieren. Die Reduzierung der Abtastrate kann jedoch das Hintergrundrauschen verändern, das in den meisten Aufnahmen vorhanden ist, und dies kann zu unerwünschten Nebeneffekten (schärferes Rauschen) führen und schließlichZischenProbleme („S“-Laute) oder schlichte Leblosigkeit – selbst bei sehr hohen Bitraten. Die Verringerung der Abtastrate kann ein sehr effektiver Kompromiss sein, wenn mit sehr niedrigen Bitraten gearbeitet wird; Voice-over-IP-Telefonieprotokolle sind ein hervorragendes Beispiel dafür.

Nennen wir die AbtastrateKlangfülle.

  • Stereo: Wenn Ihr Ton größtenteils mono ist, z. B. Sprache, verschwenden Sie die Hälfte der Bandbreite, wenn Sie ihn als Stereo kodieren (es sei denn, es handelt sich um Joint-Stereo, aber das ist eine andere Geschichte).

Bei Musik ist es meiner Meinung nach allgemein bekannt, dass 128 kbps 44,1 kHz Stereo bei MP3 der Wendepunkt ist, an dem eine gewisse Verschlechterung der Musikqualität für fast jeden wahrnehmbar ist, sie aber immer noch hörbar ist. Da Sprache leichter zu kodieren ist als Musik, denke ich, dass das Mono-Äquivalent - MP3 64 kbps 44,1 kHz - einen guten Ausgangspunkt mit ausreichender Qualität für die meisten Zwecke bietet, ohne übertrieben zu sein.

Schließlich soll Windows Media Audio viel effizienter sein als MP3. Sie können diese Referenzpunkte also problemlos um 25-40 % verschieben (z. B. sollte WMA 40 kbps ähnlich sein wie MP3 64 kbps). WMA Professional soll anscheinend besser sein als WMA 9Reduzierung der Anzahl von Kodierungsoptionen mit niedriger Bitratedass WMA9 über WMA9 verfügt und automatisch die beste Methode für die meisten Inhalte verwendet. Wenn Sie die Wiedergabe also nicht auf Geräten durchführen müssen, die nur WMA9 unterstützen, ist dies wahrscheinlich die bessere Option.

Hoffentlich können Sie sich von dort aus nach oben (oder unten) arbeiten.

verwandte Informationen