Ich habe mal etwas mit hochauflösendem Audio-Material herumexperimentiert und stelle die Ergebnisse unter folgendem Link zum Download zur Verfügung:
https://www.dropbox.com/sh/kht4x7b4r5nq7t2/--zaw5zlSD
Hier stehen drei Ordner zur Verfügung – einmal unter Wave die Wave-Dateien, unter FLAC die Flac-Dateien und unter Bilder Spektral-Analyse die Screenshots von Spektral-Analysen, die mittels Samplitude 11 von dem Audiomaterial erstellt wurden.
Alles zusammen ist auch nochmal in eine Zip-Datei zusammengefügt, die man einfacher als die Einzeldateien herunterladen kann:
HD-Audio Vergleichsmaterial.zip (Achtung: 302 MB ). Alternative kann man auch die Zip-Datei HD-Audio Vergleichsmaterial_ohne-Wave-Dateien-nur-FLAC.zip laden... (119 MB )
Ausgangsbasis war die Aufnahme eines Drumsets mit einer Sampling-Frequenz von 96 kHz und einer Auflösung von 24 Bit. Die Aufnahme ist mit einem Alesis HD24XR gemacht worden, der über AD-Wandler mit 24 Bit Auflösung und eine maximale Samplingfrequenz von 96 kHz verfügt. Als Mikrofone kamen zwei AKG C414B-ULS zum Einsatz. Die Mikrofonverstärker waren in diesem Fall die internen Preamps eines Tascam DM24 Mischpults.
Diese Ausgangsdatei hat den Namen 96kHz_24Bit_nativ.wav (.flac)
Die erste Frage dazu war, wie viel Audioanteil über ca. 20 kHz denn nun in so einer Aufnahme enthalten ist. Das Bild 96kHz_24Bit_nativ.jpg zeigt den Bereich über 19 kHz bis ca. 40 kHz. In dem Spektrogramm ist zu erkennen, dass bis ca. 37 kHz Audioinformationen vorliegen. Es spielt sich also etwas über dem Frequenzbereich der CD (maximal 22,05 kHz, in der Praxis eher 20-21 kHz) ab.
Die nächste Frage war für mich, ob diese Audioinformationen oberhalb von 20 kHz zu einem hörbaren Klangunterschied führen? Die Antwort darauf lässt sich finden, wenn man unter gleichen Bedingungen die 96/24er Datei mit einer in der Bandbreite beschränkten Datei vergleicht. Und genau hier geht das Problem los: Gleiche Bedingungen lassen sich so ohne weiteres gar nicht so einfach herstellen. Mein zum Abhören genutzter DA-Wandler gibt zwar alles bis 96/24 wieder, aber wenn ich einen Vergleich zu z.B. einer 44,1 kHz / 16bit Version der gleichen Aufnahme machen will, dann muss ich den Wandler umstellen und die Soundkarte (RME HDSP 9652) ebenfalls. Ein Vergleich ist so nicht möglich, denn in den 15-20 Sekunden, die die Umstellerei dauert, ist der Höreindruck längst weg.
Also habe ich mittels des herausragenden FFT-Filters aus dem Programm Samplidude 11 steilflankige Tiefpassfilter bei 20, 22 und 24 kHz auf das Ausgangsmaterial angewendet, die den jeweils über der Grenzfrequenz liegenden Anteil rigoros ausblenden, ohne dabei das restliche Signal zu beeinflussen. Siehe dazu die drei Spektrogramme
96kHz_24Bit_20kHz-SAM11-FFT-Cutoff.jpg
96kHz_24Bit_22kHz-SAM11-FFT-Cutoff.jpg
96kHz_24Bit_24kHz-SAM11-FFT-Cutoff.jpg
Die Audio-Dateien heißen bis auf die Endung (.wav bzw. .flac) genauso und diese kann man nun ohne Umstellungen an der Wiedergabekette im Vergleich anhören und sich ein Urteil darüber bilden, ob 96/24 sinnvoll oder nur Hype ist.
Die bei 20 kHz beschnittene Aufnahme dürfte wohl in etwa dem entsprechen, was aus einem durchschnittlichen CD-Player an Frequenzen herauskommt (wobei dieser natürlich nur über eine 16-Bit-Auflösung verfügt und nicht 24-Bit wie hier in den Files).
Die Datei mit 22 kHz Tiefpass stellt das Maximum an Frequenzgang dar, was bei einer CD technisch möglich ist.
Die Datei mit dem 24 kHz Tiefpass stellt das Maximum bei einer Samplingrate von 48 kHz dar.
Wer über die technischen Möglichkeiten verfügt, 96/24-Dateien über die hauseigene Hardware wiederzugeben (ohne dass irgendeine Software heimlich eine Sample-Rate-Conversion anwendet oder die Bit-Tiefe beschneidet), der kann hier in aller Ruhe sein Gehör testen…
Und was bringen die 24 Bit Auflösung? Klingt das besser als z.B. die 16 Bit der CD? Und klingt eine 8 Bit Aufnahme dann wie vom Atari wiedergegeben?
Man nehme sich die folgenden Dateien vor:
96kHz_24Bit_nativ.wav
96kHz_16Bit_nativ_SAM11-POWR3-NoiseShaper.wav
96kHz_8Bit_nativ_SAM11-POWR3-NoiseShaper.wav
Die erste ist die Ausgangsdatei mit voller Bandbreite und Auflösung. Aus dieser Datei wurden unter Verwendung des POW-r 3 Noise-Shaping Algorithmus Versionen mit einer 16 bzw. 8-Bit Auflösung erstellt.
Und? Klingt 24 Bit jetzt per se besser als 16 Bit? Ist 8 Bit überhaupt noch anhörbar? Es möge sich jeder selbst erstmal ein Urteil bilden…
Wer mit der Wiedergabe-Hardware beschränkt auf die normalen Samplingfrequenzen von 44,1 oder 48 kHz ist, der kann die mittels Samplitude 11 heruntergerechneten Audio-Dateien verwenden zum Vergleichen:
48kHz_24Bit_SAM11-SRC-UH2.wav
48kHz_16Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav
48kHz_8Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav
44.1kHz_24Bit_SAM11-SRC-UH2.wav
44.1kHz_16Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav
44.1kHz_8Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav
Der verwendete Algorithmus zur Sample-Rate-Conversion in Samplitude 11 ist übrigens die Einstellung „extrem hoch 2“ gewesen – diese rechnet ewig, aber dafür besonders genau und mit sehr geringen Artefakten im Audiosignal.
Die Datei 44.1kHz_16Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav ist die Qualität, die man von einer normalen CD geliefert bekommt.
Wer jetzt z.B. über einen Netzwerkplayer verfügt, der klaglos FLAC-Dateien bis 96/24 abspielt, der kann ja mal die Ausgangsdatei
96kHz_24Bit_nativ.wav (.flac)
direkt gegen die
44.1kHz_16Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav
vergleichen und dann für sich entscheiden, ob sich der Kauf von High-Res-Audiodateien lohnt…
Das alles hier ist eine Menge an Material, das erstmal verdaut sein will – ich warte mal euer Feedback ab und gebe dann auch gerne meine Eindrücke zum Besten… viel Spass beim Vergleichshören!
PS: Sorry für das teilweise desolate Getrommel!