Was bringt die Aufnahme in 96/24 ? Vergleichsdateien

  • Ich habe mal etwas mit hochauflösendem Audio-Material herumexperimentiert und stelle die Ergebnisse unter folgendem Link zum Download zur Verfügung:


    https://www.dropbox.com/sh/kht4x7b4r5nq7t2/--zaw5zlSD


    Hier stehen drei Ordner zur Verfügung – einmal unter Wave die Wave-Dateien, unter FLAC die Flac-Dateien und unter Bilder Spektral-Analyse die Screenshots von Spektral-Analysen, die mittels Samplitude 11 von dem Audiomaterial erstellt wurden.


    Alles zusammen ist auch nochmal in eine Zip-Datei zusammengefügt, die man einfacher als die Einzeldateien herunterladen kann:


    HD-Audio Vergleichsmaterial.zip (Achtung: 302 MB ). Alternative kann man auch die Zip-Datei HD-Audio Vergleichsmaterial_ohne-Wave-Dateien-nur-FLAC.zip laden... (119 MB )


    Ausgangsbasis war die Aufnahme eines Drumsets mit einer Sampling-Frequenz von 96 kHz und einer Auflösung von 24 Bit. Die Aufnahme ist mit einem Alesis HD24XR gemacht worden, der über AD-Wandler mit 24 Bit Auflösung und eine maximale Samplingfrequenz von 96 kHz verfügt. Als Mikrofone kamen zwei AKG C414B-ULS zum Einsatz. Die Mikrofonverstärker waren in diesem Fall die internen Preamps eines Tascam DM24 Mischpults.


    Diese Ausgangsdatei hat den Namen 96kHz_24Bit_nativ.wav (.flac)


    Die erste Frage dazu war, wie viel Audioanteil über ca. 20 kHz denn nun in so einer Aufnahme enthalten ist. Das Bild 96kHz_24Bit_nativ.jpg zeigt den Bereich über 19 kHz bis ca. 40 kHz. In dem Spektrogramm ist zu erkennen, dass bis ca. 37 kHz Audioinformationen vorliegen. Es spielt sich also etwas über dem Frequenzbereich der CD (maximal 22,05 kHz, in der Praxis eher 20-21 kHz) ab.


    Die nächste Frage war für mich, ob diese Audioinformationen oberhalb von 20 kHz zu einem hörbaren Klangunterschied führen? Die Antwort darauf lässt sich finden, wenn man unter gleichen Bedingungen die 96/24er Datei mit einer in der Bandbreite beschränkten Datei vergleicht. Und genau hier geht das Problem los: Gleiche Bedingungen lassen sich so ohne weiteres gar nicht so einfach herstellen. Mein zum Abhören genutzter DA-Wandler gibt zwar alles bis 96/24 wieder, aber wenn ich einen Vergleich zu z.B. einer 44,1 kHz / 16bit Version der gleichen Aufnahme machen will, dann muss ich den Wandler umstellen und die Soundkarte (RME HDSP 9652) ebenfalls. Ein Vergleich ist so nicht möglich, denn in den 15-20 Sekunden, die die Umstellerei dauert, ist der Höreindruck längst weg.


    Also habe ich mittels des herausragenden FFT-Filters aus dem Programm Samplidude 11 steilflankige Tiefpassfilter bei 20, 22 und 24 kHz auf das Ausgangsmaterial angewendet, die den jeweils über der Grenzfrequenz liegenden Anteil rigoros ausblenden, ohne dabei das restliche Signal zu beeinflussen. Siehe dazu die drei Spektrogramme


    96kHz_24Bit_20kHz-SAM11-FFT-Cutoff.jpg
    96kHz_24Bit_22kHz-SAM11-FFT-Cutoff.jpg
    96kHz_24Bit_24kHz-SAM11-FFT-Cutoff.jpg


    Die Audio-Dateien heißen bis auf die Endung (.wav bzw. .flac) genauso und diese kann man nun ohne Umstellungen an der Wiedergabekette im Vergleich anhören und sich ein Urteil darüber bilden, ob 96/24 sinnvoll oder nur Hype ist.


    Die bei 20 kHz beschnittene Aufnahme dürfte wohl in etwa dem entsprechen, was aus einem durchschnittlichen CD-Player an Frequenzen herauskommt (wobei dieser natürlich nur über eine 16-Bit-Auflösung verfügt und nicht 24-Bit wie hier in den Files).


    Die Datei mit 22 kHz Tiefpass stellt das Maximum an Frequenzgang dar, was bei einer CD technisch möglich ist.


    Die Datei mit dem 24 kHz Tiefpass stellt das Maximum bei einer Samplingrate von 48 kHz dar.


    Wer über die technischen Möglichkeiten verfügt, 96/24-Dateien über die hauseigene Hardware wiederzugeben (ohne dass irgendeine Software heimlich eine Sample-Rate-Conversion anwendet oder die Bit-Tiefe beschneidet), der kann hier in aller Ruhe sein Gehör testen…


    Und was bringen die 24 Bit Auflösung? Klingt das besser als z.B. die 16 Bit der CD? Und klingt eine 8 Bit Aufnahme dann wie vom Atari wiedergegeben?


    Man nehme sich die folgenden Dateien vor:


    96kHz_24Bit_nativ.wav
    96kHz_16Bit_nativ_SAM11-POWR3-NoiseShaper.wav
    96kHz_8Bit_nativ_SAM11-POWR3-NoiseShaper.wav


    Die erste ist die Ausgangsdatei mit voller Bandbreite und Auflösung. Aus dieser Datei wurden unter Verwendung des POW-r 3 Noise-Shaping Algorithmus Versionen mit einer 16 bzw. 8-Bit Auflösung erstellt.


    Und? Klingt 24 Bit jetzt per se besser als 16 Bit? Ist 8 Bit überhaupt noch anhörbar? Es möge sich jeder selbst erstmal ein Urteil bilden…


    Wer mit der Wiedergabe-Hardware beschränkt auf die normalen Samplingfrequenzen von 44,1 oder 48 kHz ist, der kann die mittels Samplitude 11 heruntergerechneten Audio-Dateien verwenden zum Vergleichen:


    48kHz_24Bit_SAM11-SRC-UH2.wav
    48kHz_16Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav
    48kHz_8Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav


    44.1kHz_24Bit_SAM11-SRC-UH2.wav
    44.1kHz_16Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav
    44.1kHz_8Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav


    Der verwendete Algorithmus zur Sample-Rate-Conversion in Samplitude 11 ist übrigens die Einstellung „extrem hoch 2“ gewesen – diese rechnet ewig, aber dafür besonders genau und mit sehr geringen Artefakten im Audiosignal.


    Die Datei 44.1kHz_16Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav ist die Qualität, die man von einer normalen CD geliefert bekommt.


    Wer jetzt z.B. über einen Netzwerkplayer verfügt, der klaglos FLAC-Dateien bis 96/24 abspielt, der kann ja mal die Ausgangsdatei


    96kHz_24Bit_nativ.wav (.flac)


    direkt gegen die


    44.1kHz_16Bit_SAM11-SRC-UH2_SAM11-POWR3-NoiseShaper.wav


    vergleichen und dann für sich entscheiden, ob sich der Kauf von High-Res-Audiodateien lohnt…


    Das alles hier ist eine Menge an Material, das erstmal verdaut sein will – ich warte mal euer Feedback ab und gebe dann auch gerne meine Eindrücke zum Besten… viel Spass beim Vergleichshören!


    PS: Sorry für das teilweise desolate Getrommel!

  • Wow, erst mal "Hut ab" für die Arbeit :thumbup:

    Wer jetzt z.B. über einen Netzwerkplayer verfügt, der klaglos FLAC-Dateien bis 96/24 abspielt, . . .

    Warum fluchen nur alle über Magix, kann ich gar nicht verstehen, läuft prima (SMS16) ;)
    Also da ich auch z.Zt. am experimentieren bin,kommt mir das sehr passend. Selbst mit PC-Lautsprechern (low Budged) ist jedenfalls ein Unterschied zu hören, irgend wie klarer und definierter. Auf Grund der Datenmenge habe ich mich für ein "gesundes Mittelmaß" in 48/24 entschieden und, so wie ich das raushöre, hört man zur 96/24 Version "eigentlich" keinen Unterschied 8o
    Natürlich sind die einzelnen Schritte abwärts/aufwärts kaum wahrnehmbar, sobald aber 3-4 Schritte dazwischen liegen, sowol in Frequenz, als auch in Tiefe, hört man das schon, also 44.1/96 und auch 8/24.

    ...(ohne dass irgendeine Software heimlich eine Sample-Rate-Conversion anwendet oder die Bit-Tiefe beschneidet)...

    Na da hoffe ich mal das mich da keiner verarscht (Softwaremäßig), das getrommel ist zwar nicht identisch, aber die Dynamik (denke das macht mehr aus) ist doch recht konstant.
    Sehr schöner Test, mit für mich eindeutigem Fazit:
    Proben mit etwas weniger, "vernünftig" aufnehmen (besoffene raus und Tür zu) etwas mehr :thumbup:
    Greez, Josh


    Ohje, Edith meckert :whistling:
    Vorlage: 14 Spuren, von denen "7" gebraucht werden (dank Recorderman). Datenvolumen 2,5 Std.= ca.17,5 GB 8| Nur für's Proben nicht unerheblich.

  • Steilflankige Filter haben immer typischerweise eine starke Phasenverschiebung rund um die Grenzfrequenz zur Folge. Eine FFT, bei der man einfach ab einer bestimmten Linie die Spektralwerte stark reduziert, führt aufgrund der dann fehlenden Aliasingkomponenten-Auslöschung der benachbarten Bänder zu Zeitbereichsaliasing. Daher glaube ich nicht, dass dieser Vergleich unbedingt aussagekräftig bzgl. 48/96 KHz Abrastrate ist. Der Einfluss der Filter ist sicher wesentlich größer als der der prinzipiellen Abtastrate.


    Ich habe solche Vergleiche schon mal blind mit hochwertigen Abtastratenwandlern und Wiedergabesystemen (Stax-Kopfhörer und Geithain-Monitoren im Hörlabor) durchgeführt und konnte absolut keinen Unterschied hören. Das heißt natürlich nicht, dass das für alle Menschen gilt, aber ich kam damals zu dem Schluss, dass hohe Abtastraten für Musiksignale keinen Vorteil bringen. Ist aber ein heikles Thema, um das Glaubenskriege geführt werden (nicht umsonst ist das Gehör der am stärksten ans Unterbewusstsein gekoppelte Sinn), daher finde ich es gut, dass Du Dir eine eigene Meinung dazu bilden willst!

    Nix da.

    Einmal editiert, zuletzt von Rampen ()

  • 24 bit Wortbreite sind natürlich Pflicht.


    Aber alles oberhalb 44,1kHz Samplerate (bzw. 48kHz für Video) ist überflüssig, bremst die Hardware aus, bringt für sämtliche User hier klanglich exakt *nichts*, und füllt lediglich die Taschen der Equipment verkaufenden Industrie.


    Lieber in gescheite Mics und neue Felle für die Aufnahmen investieren, denn die wahre Qualität einer Produktion entscheidet sich an völlig anderer Stelle als bei irgendwelchen esoterischen Samplerates.

  • Hi,


    erstmal: Wieder mal Respekt für Olivers Mühe und Genauigkeit in Sachen Tests. Ich find's immer wieder spannend!


    Im konkreten Fall freue ich mich über (vor Equipment-/Technikwahn) warnende Worte vom Profi:

    Lieber in gescheite Mics und neue Felle für die Aufnahmen investieren, denn die wahre Qualität einer Produktion entscheidet sich an völlig anderer Stelle als bei irgendwelchen esoterischen Samplerates.

    Das war mein erster Gedanke: Wieviele Fehler und Ungenauigkeiten darf ich (als Amateur) nicht mehr machen, damit solche Finessen für meine Aufnahmen eine *tragende* Rolle zu spielen beginnen? Eine Aufnahme ist ja immer nur so gut wie ihre Faktorenkette und ... tja ... ich fürchte "Hajos Hirn und Hände" sind noch lange nicht auf 96kHz-Niveau. :)


    Grüße von
    Hajo K 44,1/24

  • Steilflankige Filter haben typischerweise eine starke Phasenverschiebung rund um die Grenzfrequenz zur Folge. Eine FFT, bei der man einfach ab einer bestimmten Linie die Spektralwerte stark reduziert, führt aufgrund der dann fehlenden Aliasingkomponenten-Auslöschung der benachbarten Bänder zu Zeitbereichsaliasing. Daher glaube ich nicht, dass dieser Vergleich unbedingt aussagekräftig bzgl. 48/96 KHz Abrastrate ist. Der Einfluss der Filter ist sicher wesentlich größer als der der prinzipiellen Abtastrate.


    Das sind vier Sätze, über die man schonmal einen Moment nachdenken kann :) Ich bin kein Experte, was die digitale Signalverarbeitung angeht und war daher bisher immer der Meinung, dass eine FFT (sofern sie sorgfältig ausgeführt ist) im Vergleich zu den steilflankigen Filtern, die z.B. vor einem AD-Wandler als Anti-Aliasing-Filter eingesetzt werden, eine zu vernachlässigende Auswirkung auf den Klang hat.
    Mir ist auch nicht ganz klar, woher in meiner speziellen Anwendung hier (ein nativ mit 96 kHz aufgenommenes Signal wird durch eine FFT in der Bandbreite begrenzt) die Aliasing-Komponenten kommen sollen - meinst Du die Anteile im Signal, die durch die nicht perfekte Anti-Aliasing-Filterung vor dem AD-Wandler entstehen - das wäre in meinem Fall das steilflankige Filter irgendwo oberhalb von 40 kHz im HD24XR? Oder meintest Du das im Vergleich zu einem nativ bei z.B. 48 kHz aufgenommenen Signal, bei dem das Anti-Aliasing-Filter irgendwo bei 22-23 kHz sitzt? Oder treten durch die FFT selber Artefakte auf, die so stark sind, dass sie den Unterschied zwischen 24 oder 48 kHz Signalbandbreite völlig überdecken?


    Eins ist mir aber völlig klar: Einen echten Vergleich kann man nur mit deutlich höherem Aufwand auf die Beine stellen - dazu müsste ich in meinem Fall Aufnahmen in den zu vergleichenden Sampling-Frequenzen erstellen, die sich jedoch nur durch diesen einen Paramater voneinander unterscheiden. Mit einem HD24XR wird das schonmal nichts und mit zweien, die das gleiche Signal aufnehmen, kommen auf einen Schlag zig zusätzlich Fehlerquellen hinzu: Fehler bei der Splittung des Signals, unterschiedliche Kabel(-wege) und Steckverbindungen, Streuung der Wandler usw. usw. Nimmt man mit dem gleichen Gerät und gleicher Verkabelung hintereinander bei zwei unterschiedlichen Samplingfrequenzen auf, unterscheidet sich das aufgenommene Signal voneinander - auch hier ist eine Vergleichbarkeit nicht gegeben.


    Die auch von Dir genannte Möglichkeit, eine hochwertige Abtastratenwandlung einzusetzen, bleibt dann wohl die realistischste Möglichkeit, wobei auch hier durch die Wandlung selber ja ein Fehler in das Signal eingerechnet wird. In meinem Fall hätte das zumindest für das mir zur Verfügung stehende Equipment eine Aussagekraft... Interessant wäre auch nochmal das Vergleichshören von kommerziellem HD-Material in 96/24 im Vergleich zum gleichen Material von CD. Dazu fehlt mir aber im Moment der DAC, der sofort von 96 auf 48 umspringt, sobald er das entsprechende Material am Eingang anliegen hat...


    Und ja, ein Blindtest zu dem Thema wäre noch viel interessanter, weil nur dann das psychologische Moment ausgeschaltet wäre. Ist doch prima - da sind noch etliche Versuche drin...

  • 24 bit Wortbreite sind natürlich Pflicht.


    Aber alles oberhalb 44,1kHz Samplerate (bzw. 48kHz für Video) ist überflüssig, bremst die Hardware aus, bringt für sämtliche User hier klanglich exakt *nichts*, und füllt lediglich die Taschen der Equipment verkaufenden Industrie.


    Lieber in gescheite Mics und neue Felle für die Aufnahmen investieren, denn die wahre Qualität einer Produktion entscheidet sich an völlig anderer Stelle als bei irgendwelchen esoterischen Samplerates.


    +1.


    Jeder zehntel Millimeter Mikroposition bei egal was bringt 100milliarden % mehr als 96k...



    einzige anwendung die mir einfällt wäre, wenn man irgendwas extrem timestretchen will (langsamer machen). dann kann natürlich ne höhere sample rate gut sein weil ja späer alles länger ist und dann für 2x 44,1 länge daten da sind..

    sieg natur.

  • moschus & Slo77y:


    Es ist mir schon klar, dass die Frage, ob eine Produktion als gut oder schlecht empfunden wird, an ganz anderer Stelle als der Samplerate entschieden wird. Und das bessere Mikrofone oder besserer Raum oder bessere Vorstufen oder bessere Ausrichtung oder neue Felle usw. mehr bringen, als 96k im Vergleich zu 48 oder 44.1 ist auch klar. Darum ging es mir jedoch nicht - es ging um die Frage, ob ich mit meinem bereits vorhandenen Equipment überhaupt einen Unterschied hören kann. Es kostet mich keinen Cent mehr, ein Jazztrio in 44.1 oder 96 kHz mtizuschneiden, solange die verfügbare Spurenzahl bei der hohen Samplerate nicht überschritten wird. Auch dem nachfolgenden Equipment ist das völlig Wurst... Die Frage ist für mich nur folgende: bringt es am Ende einen hörbaren Unterschied?


    Mich würde interessieren, wer genau diese Frage für sich schon durch Versuche mit dem eigenen oder mit fremdem Equipment geklärt hat... Rampen hat hier ja von seinen eigenen Erfahrungen bereits berichtet.

  • Hi Oliver,


    ich will hier nicht zu tief in die Theorie einsteigen, sonst artet das hier in eine Formelschlacht aus, die dem eigentlichen Sinn dieses Threads nicht hilft. Aber ein paar Worte zur Erklärung:

    war daher bisher immer der Meinung, dass eine FFT (sofern sie sorgfältig ausgeführt ist) im Vergleich zu den steilflankigen Filtern, die z.B. vor einem AD-Wandler als Anti-Aliasing-Filter eingesetzt werden, eine zu vernachlässigende Auswirkung auf den Klang hat.

    Das ist insofern richtig, dass die FFT eine perfekt rekonsturierende Transformation ist, sprich: einmal hin- und hertransformiert kommt (im Rahmen der Rechengenauigkeit) genau das gleiche raus wie vorher. Probleme treten aber dann auf, wenn man die FFT-Werte manipuliert. Fast alle Frequenzen im Signal haben Einfluss auf ALLE FFT-Werte (am meisten auf den Wert, der ihrer Frequenz am nähesten kommt, mit fallendem Einfluss auf die weiter entfernten Werte). Diese Einflüsse auf entferntere FFT-Werte nennt man auch Aliasing-Komponenten (in diesem Fall handelt es sich aber im Gegensatz zum Frequenzbereichs-Aliasing, wie man es vom Abtasten von Signalen mit Frequenzen über der halben Abstastfrequenz kennt, um sogenanntes Zeitbereichs-Aliasing). Ändert man nichts an den FFT-Werten, löschen sich diese Aliasing-Komponenten aus und alles ist gut. Ändert man aber einen FFT-Wert, ohne sich um die dazugehörigen Aliasing-Komponenten zu kümmern (und das kann man nicht mit vertretbarem Aufwand), löschen sie sich nicht mehr aus und es kommt zu Zeitbereichs-Aliasing-Artefakten. Insofern ist eine Manipulation der FFT-Werte nicht unbedingt die beste Art und Weise, zu filtern.


    Dummerweise sind die klassischen, nicht-Transformationsbasierten Filter aber auch nicht wirklich besser: rekursive Filter haben abhängig von der Flankensteilheit den genannten Einfluss auf die Phase, was auch wieder hörbar sein kann. Und das schlimmste ist: selbst linear-phasige klassische Filter machen bei steilflankiger Filterung Probleme, weil z.B. ein modulierender Oberton in der Nähe der Grenzfrequenz aus- und eingeblendet wird, jenachdem, ob er gerade unter oder über der Grenzfrequenz liegt. Das kann dann plötzlich auch wieder hörbar werden.


    Ein Gutes hat das aber alles: wenn Du trotz dieser Einflüsse bei Deinen Tests keinen Unterschied hörst, dann kannst Du sicher sein, dass für Dich 96 kHz nix bringt ^^. Wenn Du aber was hörst, hat es aber den Nachteil, dass Du nicht weißt, woran es liegt :( .


    Übrigens würde ich bei allen Hörtests definitiv zu einem Blind-Test raten, aus eigener (leidvoller) Erfahrung weiß ich, dass man sich leider IMMER selbst bescheißt, wenn man weiß, was was ist. Ich habe haufenweise Hörtests in meinem Leben gemacht und bin leider trotzdem immer wieder darauf reingefallen.


    Interessant wäre auch nochmal das Vergleichshören von kommerziellem HD-Material in 96/24 im Vergleich zum gleichen Material von CD.


    Ich würde mich nicht darauf verlassen, dass die CD-Version einer Aufnahme nur die resampelte Version des HD-Materials ist. Ich habe gehört, dass manche Studios durchaus verschiedene Mixe für CD und für HD machen (macht ja vielleicht auch Sinn, da z.B HD-Hörer vielleicht im Schnitt hochwertigere Wiedergabesysteme haben und daher mehr Dynamik o.ä. haben wollen).


    So, genug der Klugschwätzerei, das Weinglas ist leer und ich muss morgen früh raus ;) .

    Nix da.

  • Ein netter Artikel zum Thema HD Audio, nach dessen Lektüre jedem lernfähigen Menschen klar sein sollte, warum alles oberhalb 48/24 für jegliches Audiorecording keinen Sinn macht - ausser das die Industrie weiter Ihre teuren 192k interfaces verticken kann, oder sich irgendwelche selbst ernannten Gold-Esel-Ohren einbilden, dann klänge alles besser. Die Leute fallen alle darauf herein, genau wie beim Megapixel-Wahn: viel hilft viel, und mehr ist ja immer besser:)


    http://people.xiph.org/~xiphmont/demo/neil-young.html

  • Hallo in die Runde,


    ist schon ein Weilchen her dass Ihr eure Artikel geschrieben habt und (fast) alles lässt sich exakt dokumentieren und darstellen.


    Letztendlich bleibt aber der Nutzer! Wie schon angesprochen: hat er die Möglichkeit hochwertige Musik wiederzugeben ( Verstärker, Lautsprecher)?


    Und (!) will er das??


    Über all die Byte's und Bit's: so manch einer schwört auf analoge Wiedergabe (sprich Röhrenverstärker)?! Ich denke Ihr wisst was damit einher geht?


    Meine Meinung (und damit stehe ich nicht allein hier): eine sehr gute Ausstattung der Aufnahme: beginnend mit dem Mikrofon und eine saubere Weiterverarbeitung (hier ist meine Meinung die Bit-Auflösung wichtiger) lassen das Endergebnis (nach hoffentlich erfolgreichem Mastering) zu einem erfolgreichen Ergebnis werden.


    Gruß luedre

  • Ich grabe dieses ja doch "essentielle" Thema mal wieder aus ...


    Noch eine kleine Anmerkung zum Thema "Aliasing":


    Nutzen nicht moderne Wandler deswegen Oversampling?
    Spielt das also wirklich eine Rolle? ;)


    Moderne A/D Wandler arbeiten nach dem Delta Sigma Prinzip. Das sind 1bit Wandler mit extremem Oversampling. Der Hauptgrund dafür ist übrigens der einfache Aufbau des Wandlers und die Flankensteilheit des analogen Anti-Aliasing Filters. So steile Filter, die für bspw. 44,1kHz nötig sind, sind digital einfach zu realisieren, analog jedoch nicht.


    Es geht bei höheren Samplingraten übrigens genau um diesen Anti-Aliasing Filter. Je höher die Flankensteilheit, desto auffälliger der Eigenklang des Filters. An manchen Stellen der Nachbearbeitung macht sich Oversampling tatsächlich bemerkbar (speziell wenn es um den Höhenbereich und Distortion / Sättigung geht).
    Ich hatte auch schon mal meine Mixes testweise mit 88,2kHz gerendert. Das klingt tatsächlich anders. Jedoch habe ich - mal vom viel höheren Rechenaufwand ganz abgesehen - für mich rausgefunden, dass es nicht besser klingt.
    Allerdings spielt dabei auch das Resampling eine Rolle. Ein Resampling sollte im Optimalfall über eine analoge Konvertierung (bzw. generell analoge Nachbearbeitung) mit entsprechend hochwertigen Wandlern gemacht werden.


    Also alles, was über 44,1 bzw. 48kHz hinaus geht, hat höchstens bei der Aufnahme und Nachbearbeitung Relevanz. Aber auch da lohnt es sich in den aller meisten Fällen einfach überhaupt nicht (mal von Oversampling von Plugins abgesehen).
    Das aller schlimmste sind aber fertige "Produkte" bzw. Streams mit höheren Samplingraten. Weil der Großteil der bisherigen Masterings mit 16bit / 44,1kHz gemacht wurde. Die Samplingrate und Bittiefe im Nachhinein zu erhöhen ist der größte Humbug, den es gibt. Und es gibt genug Leute, die drauf reinfallen.


    44,1kHz und 48kHz können bis 22,05 bzw. 24kHz darstellen. Kein Mensch kann über 20kHz hören. Der "Zwischenraum" wird für den AA-Filter genutzt.


    Bei der Bittiefe gibts auch viele Märchen. Höhere Bittiefen als 16bit lohnen sich nur für den Aufnahme- und Bearbeitungsprozess. 16bit kann einen Dynamikumfang von 96dB darstellen. Die Musikwahrnehmbarkeit des menschlichen Gehörs hat einen Dynamikumfang von ca. 70dB.
    24bit kann einen Dynamikumfang von 144dB darstellen. Bei der Aufnahme ist das nicht nur für einen ausreichenden Headroom und höhere Dynamik (Kompression und Limiting bis zum fertigen Master lassen grüßen ...) wichtig. Sondern es ist auch unabhängig davon so, dass höher aufgelöstes Material bei der Nachbearbeitung wirklich besser klingt. Das geht sogar bis zum Encodieren in lossy Codecs wie MP3 oder AAC. Selbst getestet und mit Phasendreher bestätigt. Youtube, iTunes etc. empfehlen für den Upload auch 24bit.


    Im Normalfall wird im Mastering beim Quantisieren auf 16bit noch gedithert, was den Dynamikumfang noch mal leicht vergrößert und dem Quantisierungsrauschen entgegen wirkt.
    Und auch hier: nachträgliches Erhöhen der Bittiefe ist kompletter Mumpitz. Was einmal weg ist, ist weg.


    Ich hatte aber auch schon Mixing Jobs mit 16bit Spuren und habe da trotzdem vernünftige Ergebnisse erreicht.
    Also wenn "Digital" einen Eigensound haben sollte, dann den des AA-Filters und des Quantisierungsrauschens bzw. Dithers. Beim fertigen Ergebnis in 16bit / 44,1kHz (Audio CD) hört das aber kein Mensch mehr raus, wenn nirgendwo geschlampt wurde. :D


    ...
    Bedenklich finde ich aber die aktuelle Entwicklung mit MP3 / AAC. Unter bestimmten Bitraten leidet die Qualität dabei merklich, insbesondere wenn mehrfach in lossy encodiert wird (was häufig bei Uploads bei bspw. Youtube oder Soundcloud passiert). Verlustbehaftete Codecs mit psychoakustischen Verfahren klingen immer anstrengend. Wenn auch nur unterbewusst und ganz subtil - das Gehirn ist immer gezwungen, das Fehlende wieder hinein zu interpretieren.
    Dazu kommt, dass bei den stetig wachsenden Datenträger Kapazitäten und Internet Bandbreiten so eine starke Datenkompression gar nicht mehr nötig ist. Verlustfreie, platzsparende Codecs wie FLAC mit bspw. 16bit / 44,1kHz sollten die Zukunft sein, finde ich.

  • my two cents dazu: mein Test "analoge Aufnahme 48 vs 44,1 kHz" :


    Vinyl "Death - Spiritual Healing" (Song beinhaltet u.a. viel hohe Hihat-Linien und brutale Crash-Cymbals) von gescheitem Plattenspieler in zwei Samplitude-Projekten (mit den entsprechenden Samplerates) mit Fireface400 recordet; einmal 44,1 kHz und einmal 48 kHz, beides 24 bit - Recording. Vinylplayer-Preamp so aufgedreht, daß Peaks in Sam bei ca -3 dB waren.


    Dann aus den beiden Projekten mit neutralen Settings abgespielt und das Fireface analog (symmetrische Verbindung) mit einem zweiten Fireface an zweitem Rechner verbunden.
    Auf diesem zweiten Rechner beide Versionen in einem 88,2 kHz / 24 bit - Sam-Projekt aufgenommen.


    Der nun mögliche A-B-Vergleich zeigte unglaublich krass geilere Höhen und insgesamt einen gefühlt besseren Klang bei der ursprünglichen 48 kHz-Aufnahme; alle Leute, denen ich es vorgespielt habe, haben es bestätigt.


    Ein Typ, der sich auskennt, meinte zu mir: "du merkst das genau so krass bei 44,1 vs 48. Der Unterschied 48 , 88,2 , 96 ist dann vernachlässigbar. 44,1 kHz wäre quasi ein dann irgendwann mit 48 kHz korrigierter Fehltritt aus den Anfängen von digital audio" - Was sagt ihr dazu?


    Für mich hat es sich bestätigt und seit meinem Aufnahmetest ist für mich klar, daß es ein Fehler ist, analog in 44,1 aufzunehmen ;)

  • Hast du die Dateien noch da? Würde mich interessieren.


    Im Normalfall gibts zwischen 44,1 und 48kHz keinen nennenswerten Unterschied, weil der Filter in etwa gleich steil bleibt. Da muss man schon ganzzahlige Vielfache dieser Samplingraten nutzen, damit sich signifikant was an der Steilheit des Filters ändert.


    Allerdings sollte man ein Resampling zwischen diesen beiden Samplingraten vermeiden. Bei ganzzahligen Faktoren hält sich der Rechenaufwand und damit der "Eigenklang" des Resamplings in Grenzen. In diesem Fall ist der Faktor aber nicht ganzzahlig.


    20kHz ist im Normalfall übrigens die maximale Durchlassfrequenz des AA Filters. Allerdings hat der Filter dennoch einen - mit zunehmender Steilheit größeren - Einfluss auf den hörbaren Bereich darunter:


  • Hallo,


    meine Erfahrung dazu ist, das selbst für die ursprüngliche Aufnahme es völlig ausreicht, mit 16 Bit und 44.1 kHz aufzunehmen.


    Warum?


    Erstens, zu 44.1 kHz.
    Mit 44.1 kHz kann man bis zu 20 kHz Tonfrequenzen aufnehmen.
    Das menschliche Hörvermögen geht bis ungefähr 14-15 kHz, darüber nimmt die Wahrnehmbarkeit von Tönen kontinuierlich ab. Genauer gesagt, nimmt die Wahrnehmbarkeit von Tönen schon ab so um die 12 kHz langsam ab.
    Von daher ist es irrelevant, ob die Aufnahme Töne bis 20 kHz (44.1 kHz Samplefrequenz), bis 24 kHz oder gar bis zu 48 kHz enthält.


    Manchmal erzeugen nicht so gute Interfaces hohe Zirppgeräusche, deren Tonhöhe von der gewählten Samplingfrequenz abhängt. Manchmal erzeugen nicht so gute Interfaces Störgeräusche im Bereich oberhalb der 20 kHz.
    Bei Wiedergabe können solche Störgeräusche "Scheintöne" im oberen hörbaren Bereich erzeugen, und damit die Illusion besonderer Höhen erzeugen. Das hängt damit zusammen, dass Lautsprecher keineswegs perfekt sind und schon gar nicht darauf optimiert sind, Töne im Ultraschallbereich (oberhalb 20 kHz) wiederzugeben. Vielmehr erzeugen sie dann Verzerrungen, die sich als Töne im oberen hörbaren Bereich wiederspiegeln.


    Und manchmal sind solche besonders hoch empfundenen Höhen bei nichtverblindeten Hörtests schlicht nur Einbildung.



    Zweitens, zur Bitbreite von 16 Bit.
    16 Bit erlauben 96dB Dynamikumfang.
    Um diesen Dynamikumfang zu nutzen, benötigt man auch ein Tonsignal, dass um 96dB lauter ist als das Grundrauschen im Aufnahmestudio. Andernfalls sind von den 16 Bit einige völlig unbeschäftigt, also nutzloser Ballast. Oder kodieren nur das Grundrauschen des Aufnahmestudios, aber nicht das Musik-Nutzsignal.


    0 dB Schalldruckpegel ist ungefähr die untere Grenze dessen, was das Ohr noch wahrnehmen kann. Im mittleren Tonhöhenbereich, bei sehr hohen Tönen (15 kHz z.B.) müssten Töne noch deutlich lauter sein, damit es das Ohr hören kann.
    Grund-Störgeräusche im Tonstudio (Klima, Heizung, Verkehr, etc...) liegen bei um die 10 bis 30 dB Schalldruckpegel, je nach Akustik-Isolation.
    Grund-Störgeräusche auch der besten Mikrofone liegen bei um die 10 bis 20 dB Schalldruckpegel.


    Daraus folgt, Musik, die am Mikrofon nur um die 20 bis 30 dB Schalldruckpegel macht, ist kaum lauter als das Grundrauschen eines Studios. Selbst, wenn man den Mikro-Preamp voll aufzieht, um den Pegel auf volle 16 Bit zu verstärken. Dann hat man zwar den Nutzpegel auf vollen Pegel verstärkt, aber eben auch alle Störgeräusche um den gleichen Faktor mit verstärkt. Man hat also nichts gewonnen....


    "Leise" Signale mit Schalldruckpegel unterhalb 96dB Schalldruckpegel (plus die 20 bis 30 dB Studiogrundrauschen) lassen sich also mir 16 Bit genauso gut oder schlecht aufnehmen wie mit 24 Bit. Die Störgeräusche sind in beiden Fällen gleich laut mit drauf.


    24 Bit gewinnt also erst, wenn man Schallpegel oberhalb 96 dB + 20 bis 30 dB (Grundrauschen des Studios) aufnehmen wollte, und gleichzeitig auch Schallpegel um die 20 bis 30 dB aufnehmen will. Auf der gleichen Spur, mit dem gleichen Instrument gespielt. Wann aber will man das wirklich machen?
    Das wären Schallpegel mehr als 110 bis 120 dB. Das geht dann so langsam Richtung ohrbetäubend, und so laut will ein ernsthafter Musiker eigentlich nicht spielen...
    Wann hat man sowas je im Studio? Und wann will man auf der gleichen Spur Töne knapp über Hörbarkeitspegel (knapp oberhalb Studiogrundrauschen) aufnehmen und im Mix verwenden?


    24 Bit ist wohl nur so ein Mythos. Immerhin schadet man damit der Klangqualität nicht, obgleich es völlig überflüssig ist.
    Da 24 Bit in allen Interfaces vorhanden ist, und Festplattenplatz zur Aufzeichnung der Session auch fast nix kostet, kann man das einfach so machen, ohne wirklich Nutzen zwar, aber zur Beruhigung des Gewissens und ohne Schaden zur Klangqualität.


    Gruss

    "Es lohnt sich, in unserem Land zu leben. Da muss man für Werte eintreten, und wer diese Werte nicht vertritt, der kann jederzeit dieses Land verlassen, wenn er nicht einverstanden ist. Das ist die Freiheit eines jeden Deutschen." - Walter Lübcke, 22. 8. 53 - 2.6.19, ermordet.

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!