Digitale Audio-Signalverarbeitung (Bittiefe, Abtastrate) - ein paar Fakten (mit Video)

  • Das Thema wurde hier ja noch nicht näher explizit beleuchtet (wenn doch, berichtige man mich bitte). Warum ich das gerade jetzt hier erstelle -> siehe unten. Das Video von Monty Montgomery erklärt das Wichtigste. Ich mach aber noch ein paar Ergänzungen.


    Externer Inhalt www.youtube.com
    Inhalte von externen Seiten werden ohne deine Zustimmung nicht automatisch geladen und angezeigt.
    Durch die Aktivierung der externen Inhalte erklärst du dich damit einverstanden, dass personenbezogene Daten an Drittplattformen übermittelt werden. Mehr Informationen dazu haben wir in unserer Datenschutzerklärung zur Verfügung gestellt.


    Bittiefe

    • Die Bittiefe bestimmt den Rauschabstand. Je mehr Bits, desto weiter liegt das Quantisierungsrauschen unter 0dBFS (dB FullScale). 16bit (CD) hat einen Rauschabstand von 96dB, d.h. das Quantisierungsrauschen liegt hier bei -96dBFS. Die Rechnung ist einfach: pro Bit werden 6dB dargestellt. 24bit (Studiostandard) hat also einen Rauschabstand von 144dB. 32bit floating point ist definitiv "Overkill", hat aber den Vorteil von Übersteuerungsfreiheit. Das ganze hat nichts mit der internen Verarbeitung von DAWs zu tun, die heutzutage die Hardware Resourcen (64bit CPUs) voll ausnutzen -> alle modernen DAWs rechnen intern standardmäßg mit 64bit floating point.
    • Die menschliche Hörfläche umfasst bei Musik ca. 60dB. 16bit reichen für fertig produzierte Musik also vollkommen aus. Auch für Tracks mit sehr hoher Verlaufsdynamik (z.B. Klassik): eine Verdoppelung der wahrgenommenen Lautstärke (Lautheit, psychoakustisch) entspricht ungefähr 10dB, eine technische Verdoppelung (Spannung) sind sogar nur 6dB.
    • Dither ist zwar auch nur ein Rauschen, allerdings "ersetzt" es das Quantisierungsrauschen nicht (das wird im Video etwas missverständlich ausgedrückt). Der Dither wirkt auf das LSB (unterstes Bit) und muss als letzter Schritt vor der Kodierung dem Signal hinzugefügt werden. Dither erhöht tatsächlich die Auflösung und ermöglicht es, Signale unterhalb des Grenzwerts der jeweiligen Bittiefe kodieren zu können. Bob Katz schreibt dazu in seinem Buch "Mastering Audio", dass sogar Testtöne, die unter -130dBFS liegen, mit 16bit Gedithert noch erfasst werden können. Und dazu kommt eben noch "Noise Shaping" (siehe Video), das das Ditherraschen z.B. hauptsächlich in den erweiterten Höhenbereich verschiebt, wo unsere Hörschwelle sehr hoch ist. Hier haben höhere Abtastraten übrigens tatsächlich einen entscheidenden Vorteil: Der Dither kann hauptsächlich in den Bereich über 20kHz "verschoben" werden. Die maximale Frequenz des Dithers muss sowieso mindestens so hoch sein wie die maximale Frequenz des Nutzsignals (also i.d.R. 20kHz), damit er das gesamte Spektrum des Nutzsignals "dithert" (umgekehrt nicht).
    • 24bit sind nur für den Produktionsprozess relevant: Hier arbeitet man mit viel Headroom und unkomprimierten Signalen. Das Quantisierungsrauschen von 24bit liegt übrigens deutlich unterhalb des Grundrauschens von A/D Wandlern (bspw. >100dB SNR), Preamps (Neve 1073 - ein absoluter Klassiker -> ca. 93dB SNR) und Mikrofonen.


    1920px-Hoerflaeche.svg.png


    2560px-Kurve_gleicher_lautst%C3%A4rke.svg.png



    Abtastrate

    • Die Abtastrate muss mindestens doppelt so hoch sein wie die maximale Frequenz eines Signals (Nyquist-Shannon-Abtasttheorem). Die maximal darstellbare Frequenz einer bestimmten Abtastrate ist die Nyquist-Frequenz, diese ist also immer halb so groß wie die Abtastrate. Die Nyquist Frequenz von 44,1kHz Abtastrate ist demnach 22,05kHz.
    • Beinhaltet das abzutastende Signal höhere Frequenzen als die Nyquist Frequenz, entstehen Alias Effekte. Bis zur Abtastrate wird die Frequenz dabei an der Nyquist Frequenz gespiegelt. Ein 30kHz Sinus liegt nach dem Quantisieren mit 48kHz dann also bei 18kHz. Quantisiert man einen 50kHz Sinus mit 48kHz, liegt der Sinus anschließend bei 2kHz. D.h., dass das Signal vor der Abtastung auf jeden Fall begrenzt werden muss, was ganz einfach mit einem Lowpass Filter (im speziellen Fall hier Anti-Aliasing Filter genannt) gemacht wird. Analog->Digital Umsetzer (und umgekehrt auch Digital->Analog Umsetzer) arbeiten dabei mit extrem hohen Oversampling - darauf will ich hier aber nicht näher eingehen.


    Relevanter Frequenzbereich geht bis 20kHz

    • Kein Mensch kann über 20kHz hören. Zudem verschlechtert sich die Wahrnehmung der Höhen mit zunehmendem Alter immer weiter. Ich bin 29 und kann noch bis ca. 16,5kHz etwas hören, ab 14kHz wird's aber schon schwierig (hab gerade noch mal einen Selbsttest gemacht).
    • Das Frequenzspektrum von Sprache bzw. Gesang und allen gängigen Instrumenten geht im Groben auch nur bis 20kHz. Darüber passiert nichts nennenswertes mehr (man kann mich auch gerne berichtigen, aber Ausnahmen bestätigen letztlich sicher die Regel).
    • Die meisten Mikrofone und die gesamte gebräuchliche Tontechnik sind auf den hörbaren Bereich bis 20kHz ausgelegt. Viele dynamische Mikrofone fallen sogar schon zwischen 10 und 20kHz steil ab.


    Überabtastung

    • Eine Überabtastung hat keinen nutzbaren Informationsgewinn zur Folge und stellt den Frequenzverlauf auch nicht exakter dar! 44,1 oder 48kHz reichen für die Abtastung bis 20kHz vollkommen aus. Warum das so ist, wird im Video oben sehr gut veranschaulicht. Es gibt auch nichts "zwischen" den Samples, das verloren gehen könnte. Die größten Trugschlüsse dabei sind, sich die Samples als Treppchen oder - noch schlimmer - sich gerade Verbindungslinien zwischen den Samples vorzustellen. Beides existiert nicht.
    • Höhere Abtastraten haben nicht weniger Aliasing zur Folge als niedrige. Der Anti-Aliasing Filter schneidet immer bei jeder Abtastrate genug weg, um Aliasing komplett zu verhindern. Die Cut-off Frequenz des Anti-Aliasing Filters liegt immer, auch bei extremem Oversampling, knapp über 20kHz. Der einzige Effekt, den höhere Samplingraten also erst mal haben, ist eine geringere Flankensteilheit des Anti-Aliasing Filters (siehe Grafik unten).
    • Der springende Punkt dabei ist lediglich, dass "Rippling" (siehe Video) entsteht, wenn der Anti-Aliasing Filter etwas wegschneidet. Passiert von vorn herein nichts über 20kHz, macht es schlichtweg keinen Unterschied mit welcher Abtastrate abgetastet wird. Im Video wird auch erwähnt, dass das Rippling mit geringerer Flankensteilheit des Filters schwächer wird. Um mehr geht es dabei schlicht und einfach nicht.


    digi.oversamling.png



    Resampling

    • ... ist das Konvertieren eines digitalisierten Signals in eine andere Abtastrate. Das hat weitere Auswirkungen auf den Klang. Es gibt dafür 2 verschiedene Möglichkeiten: Entweder man macht das Resampling über eine analoge Wandlung oder man macht es rein digital.
    • Ein rein digitales Resampling ist insbesondere bei nicht ganzzahligen Vielfachen zu vermeiden. Nimmt man bspw. in 96kHz auf und will am Ende für CD mit 44,1kHz mastern, empfiehlt sich ein Resampling über eine analoge Kette. Letzteres kann in Mastering Studios sehr einfach und auch ohne zusätzlichen Aufwand gemacht werden, weil i.d.R. sowieso hochwertige analoge Effekte für den letzten Schliff benutzt werden.
    • Der Rechenaufwand eines digitalen Resamplings kann stark variieren. Auch sehr rechenintensive Algorithmen produzieren Artefakte und Verfärbungen. Hier kann man einschlägige SCRs (SampleRateConverters) dahingehend vergleichen: SRC Comparisons
    • Bei Oversampling in Plugins wird immer auf ganzzahlige Vielfache gesampelt (genau genommen ist das ein Upsampling). So hält sich der Rechenaufwand in Grenzen und die Vorteile der Berechnung mit der höheren Abtastrate sind größer als die Nachteile des Resamplings selbst (was auch nur bei bestimmten Effekten der Fall ist).
    • Das beim Benutzen höherer Samplingraten während der Produktion nötige, den Klang beeinflussende Resampling ist ein weiterer Grund dafür, das Aufnehmen mit höheren Samplingraten insbesondere im Homerecording Bereich auf rein digitaler Ebene in Frage zu stellen. Wenn man es trotzdem macht, sollte man zumindest ganzzahlige Vielfache der Ziel-Samplingrate benutzen. Also für 44,1kHz dann demnach 88,2 oder 176,4kHz, nicht 96 oder 192kHz.


    -----------------------------------------------------------------------------------------------------------------------------------------
    Bis vor kurzem dachte ich noch, dass das Rippling auch von der "Qualität" bzw. Bauweise des Filters abhängt, aber das stimmt nicht. Im Video wird gezeigt (und wer es noch nicht angeschaut hat -> guckt euch das verdammte Video an :D ), dass das Rippling ein Effekt eines Bandlimitierten Signals ist und sich auch mathematisch erklären lässt.


    Aber warum macht man Oversampling überhaupt, wenn man spätestens im finalen Mastering sowieso mit 44,1 oder 48kHz quantisiert?
    Das beste Beispiel ist wohl nachträgliches Oversampling bei der Nachbearbeitung. Von vorn herein mit bspw. 96kHz aufzunehmen hat nicht nur den (statt bei 48kHz) doppelt so hohen Speicherplatzbedarf zur Folge, sondern auch den doppelt so hohen Rechenaufwand bei jedem Bearbeitungsschritt.
    Oversampling bei der Nachbearbeitung ist dann sinnvoll, wenn Bearbeitungsschritte zusätzliche Frequenzanteile über 20kHz erzeugen. Hat man mit 44,1 oder 48kHz aufgenommen, ist spätestens ab 22,05 oder 24kHz ja schon nichts mehr vorhanden. Das typischste und häufigste Anwendungsbeispiel ist Verzerrung bzw. Sättigung. Dadurch werden harmonische Oberschwingungen erzeugt. Mit Oversampling entsteht dabei also weniger Rippling im hörbaren Bereich. Nach der Bearbeitung muss natürlich wieder runter gesampelt werden. Ich habe damit selbst viel experimentiert. Vor allem bei einem Clipper Plugin, das ich nutze, macht sich das bemerkbar - da gehts aber gleich um 32x Oversampling (bei 44,1kHz sind das über 1,4MHz). Es erscheint vielleicht unlogisch, weil nach dem Bearbeitungsschritt ja sowieso wieder runter gesampelt wird. Aber es geht darum, dass die Bearbeitung den Sound eben formt und dabei macht sich weniger Rippling durch einen flacheren Anti-Aliasing Filter bemerkbar.
    Es gibt wahrscheinlich auch immer mehr Plugins, die standardmäßig mit Oversampling arbeiten, ohne dass man das sehen oder einstellen kann. Anders kann ich mir die CPU-Auslastung einiger Plugins jedenfalls nicht erklären. Ich kann aber definitiv sagen, dass Oversampling allein noch keinen guten Klang macht. Ich kenne einige sehr CPU-freundliche Plugins, die sicher ohne Oversampling auskommen und hervorragend klingen.


    Würde es sich lohnen, Produktionen in Zukunft komplett in 96kHz oder höher zu fahren und auch zu verkaufen?
    Meiner Meinung nach überhaupt nicht. Der höhere Aufwand im Produktionsprozess lässt sich mit der immer leistungsfähigeren Technik zwar ohne weiteres bewerkstelligen. Aber letztendlich verhält es sich hier ähnlich wie mit der Bittiefe: Höhere Auflösung während der Produktion ist (bei Oversampling auch nur stellenweise) sinnvoll. Aber spätestens danach hört keiner mehr einen Unterschied.


    Bringt es etwas, sich fertig produziertes "High Res" Audio zu kaufen oder streamen?
    Nein! Weil wahrscheinlich 99,9% der bisher fertig gemasterten Musik in 44,1 oder (selten) 48kHz quantisiert wurde. Und was einmal weg ist, ist weg. Bittiefe und Samplingrate im Nachhinein zu erhöhen ist Blödsinn.



    * Quellen der Grafiken über URL einsehbar

  • Sehr schön zusammengefasst, dankeschön! Eine Anmerkung zu Verzerrern hätte ich noch: diese erzeugen unter anderem zusätzliche Frequenzen, die der Differenz von Frequenzen im Eingangssignal entsprechen. Dadurch können Eingangsfrequenzen oberhalb von 20kHz wiederum hörbare Frequenzen erzeugen, was ein weiteres Argument dafür wäre, hohe Abtastraten in der Produktion zu verwenden. Ob das nun wirklich einen qualitativen Unterschied macht bei einem Verzerrer sei dem jeweiligen Produzenten überlassen ;) .

    Nix da.

  • Danke für den Aufwand! Schön einfach geschrieben :)


    Kleine (kleinkarierte) Ergänzung weil ich es gerade mit Schülern ausprobiert habe: Es gibt auch junge Menschen (in dem Fall um die 20 Jahre), die noch 19 kHz, eine Schülerin sogar bis 20 kHz hört (Sinus). Aber ab 16 kHz wird die Luft nichts desto trotz schon sehr dünn (ca. 5 von 35 SchülerInnen).

  • Kürzlich bin ich über Facebook Musiker Gruppen auf zwei Youtube Videos im Netz gestoßen, die das Aufnahmen in höheren Abtastraten (88,2kHz und höher) auch im Homerecording Bereich "anpreisen" und das ganze mit völlig an den Haaren herbei gezogenen, weil nicht vorhandenen Zusammenhängen, rechtfertigen.


    Was ist denn hier* mit? Dir (m_tree) fiel doch auch ein markanter Unterschied auf...


    * Es ist aber tatsächlich ein durchaus markanter Unterschied zwischen 44,1 kHz Aufnahmen und 48 kHz Aufnahmen zu hören. Das hat mir mal ein Kenner verklickert und es auch irgendwie mit den Rändern der Frequenz-Range erklärt (hab die Erklärung aber nicht mehr wirklich detailliert auf dem Schirm...). Ich habe daraufhin folgenden Test gemacht: Musik von Viny-Platte (u.a. "Death - Spiritual Healing") mit RME Fireface in Samplitude analog in 24 bit recordet, einmal mit 44,1 und einmal mit 48 kHz (in demnach zwei unteschiedlichen Projekten, die der Samplerate entsprechen). Dann habe ich mit einem weiteren Rechner und einem weiteren Fireface die beiden Projekte über Playback vom ersten Fireface nochmal analog aufgenommen, diesmal mit fixen 88,2 kHz (und 24 bit). Beim A-B-Vergleich (gecheckt über hochwertige Abhören) dieser letzten Aufnahmen fällt Folgendes auf: Vor allem die Höhen (z.B. der Sound der Becken und Hihat) der ursprünglichen 48 kHz-Aufnahme sind viel brillianter und ausdrucksstärker und geiler, und der Insgesamtklang ist bei 48 in meinen Ohren viel geiler; die 44,1-Aufnahme stinkt für mich regelrecht ab.


    Die Beweis-Files sind noch online, also, wer sich überzeugen will, kann das tun.

  • Danke. Freut mich, wenn es brauchbar ist. Ich mache es auch nicht ganz uneigennützig, weil mir dadurch auch einiges noch etwas klarer wird und sich festigt.


    Ich habe den Startpost mal aktualisiert. Vor allem habe ich einen weiteren Absatz zum "Resampling" hinzugefügt, habe aber auch die Aussage zur Hörverschlechterung im Höhenbereich korrigiert (sich selbst als Beispiel zu nehmen ist doch immer das einfachste :D ).


    Rampen
    D.h. also quasi, dass ein Verzerrer "echter" und "analoger" mit höheren Samplingraten klingt, weil so auch Frequenzen über 20kHz hörbare "Unterschwingungen" erzeugen können?


    Ich hatte da vor einiger Zeit mal relativ viel rumprobiert und war auch ein bisschen dem "High Res" Wahnsinn verfallen, hatte damals aber schon die Zusammenhänge verstanden. Zum Beispiel hatte ich komplette Mixe in 88,2 statt 44,1kHz gerendert und blind verglichen. Mein Fazit war damals ungefähr: "Ok, ich kann wirklich einen Unterschied hören. Aber ich finde den 88,2kHz nicht besser, sondern nur anders. Außerdem wird ein beträchtlicher Anteil des Unterschieds dem Resampling geschuldet sein". ;)
    Das Resampling hatte ich auf der höchsten Qualitätsstufe gemacht, und der damals schon aktualisierte Reaper SRC (siehe hier -> https://src.infinitewave.ca/) war schon ziemlich gut im allgemeinen Vergleich.


    Benutzt man höhere Samplingraten während der Produktion außerhalb von Plugin-internem Oversampling, dann sollte man m.E. auf jeden Fall schon von vorn herein so aufnehmen und erst ganz zum Schluss runter sampeln. Und das wiederrum eben am besten auch über eine analoge Kette. So machen es die "Profis" jedenfalls.


    Was ist denn hier* mit? Dir (m_tree) fiel doch auch ein markanter Unterschied auf...


    * Es ist aber tatsächlich ein durchaus markanter Unterschied zwischen 44,1 kHz Aufnahmen und 48 kHz Aufnahmen zu hören. Das hat mir mal ein Kenner verklickert und es auch irgendwie mit den Rändern der Frequenz-Range erklärt (hab die Erklärung aber nicht mehr wirklich detailliert auf dem Schirm...). Ich habe daraufhin folgenden Test gemacht: Musik von Viny-Platte (u.a. "Death - Spiritual Healing") mit RME Fireface in Samplitude analog in 24 bit recordet, einmal mit 44,1 und einmal mit 48 kHz (in demnach zwei unteschiedlichen Projekten, die der Samplerate entsprechen). Dann habe ich mit einem weiteren Rechner und einem weiteren Fireface die beiden Projekte über Playback vom ersten Fireface nochmal analog aufgenommen, diesmal mit fixen 88,2 kHz (und 24 bit). Beim A-B-Vergleich (gecheckt über hochwertige Abhören) dieser letzten Aufnahmen fällt Folgendes auf: Vor allem die Höhen (z.B. der Sound der Becken und Hihat) der ursprünglichen 48 kHz-Aufnahme sind viel brillianter und ausdrucksstärker und geiler, und der Insgesamtklang ist bei 48 in meinen Ohren viel geiler; die 44,1-Aufnahme stinkt für mich regelrecht ab.


    Die Beweis-Files sind noch online, also, wer sich überzeugen will, kann das tun.


    Ich habe mir das gerade noch mal in der DAW angehört. Und ich höre immer noch Unterschiede. Allerdings sind die zum einen subtil und zum anderen empfinde ich die Unterschiede wieder nur als "anders", nicht besser oder schlechter.


    Ich habe die Files zusätzlich "aligned", also quasi Sample-genau übereinander geschoben, um mal zu schauen, was bei einem Phasendreher übrig bleibt ... und zwar eine ganze Menge, im gesamten Spektrum. Das leuchtet mir insofern ein, weil du laut deiner Beschreibung zwei Aufnahmen gemacht hast. Und hier kommt die analoge Technik ins Spiel, die nie genau gleich klingt. Eine Schallplatte nutzt sich genau so ab wie Tonband und klingt durch mechanische und Witterungsbedingte Einflüsse eben immer mal etwas anders (Kenner wissen hier sicherlich besser bescheid, ich kenne mich mit Vinyl nicht so aus).


    Wirklich vergleichen könnte man das m.E. nur, wenn man wirklich die exakt selbe Aufnahme unterschiedlich quantisiert. Und um dem Ganzen noch die Krone aufzusetzen: eigentlich auch nur, wenn man das Material anschließend auch exakt gleich abmischt und mastert. Denn das Hauptaugenmerk liegt bei der ganzen Geschichte hier ja auf der Produktionsschiene. Nicht auf dem Digitalisieren von analogen Tonträgern.


    ...
    Man darf dabei auch nicht vergessen, dass Placebo auch hier eine Rolle spielt und die Ohren sich sehr schnell täuschen können. Auch mit einem A/B Vergleich kann man sich selbst übers Ohr hauen. Nämlich dann, wenn man nicht blind vergleicht ...

  • Eine Schallplatte nutzt sich genau so ab wie Tonband und klingt durch mechanische und Witterungsbedingte Einflüsse eben immer mal etwas anders (Kenner wissen hier sicherlich besser bescheid, ich kenne mich mit Vinyl nicht so aus).

    Nee, das kannst du mir nicht weis machen, daß der Absand von vielleicht 5 min zwischen den beiden Vinyl-Playbacks mechanische und witterungsbedingte Einflüsse gegeben hat.


    Wirklich vergleichen könnte man das m.E. nur, wenn man wirklich die exakt selbe Aufnahme unterschiedlich quantisiert.

    Glaub ich kaum: ich kann diesen Test beliebig oft wiederholen, es kommt immer dabei raus, daß 48 besser und brillianter klingt (habe den Test nämlich schon wiederholt...). Nur "anders" hat bis jetzt noch keiner gesagt, dem ich den Vergleich gezeigt habe: alle waren bislang der Meinung des wesentlich besseren Klangs des 48 kHz-Recordings. Wie gesagt, die Interessierten können voten, die Files sind noch online, ich lade dazu ein. (Wer's haben möchte, schreibt bitte 'ne PM wegen Passwort, weil ich den Überblick behalten möchte.)


    Und um dem Ganzen noch die Krone aufzusetzen: eigentlich auch nur, wenn man das Material anschließend auch exakt gleich abmischt und mastert. Denn das Hauptaugenmerk liegt bei der ganzen Geschichte hier ja auf der Produktionsschiene. Nicht auf dem Digitalisieren von analogen Tonträgern.

    Ich habe weder was abgemischt, noch gemastered.


    Man darf dabei auch nicht vergessen, dass Placebo auch hier eine Rolle spielt und die Ohren sich sehr schnell täuschen können. Auch mit einem A/B Vergleich kann man sich selbst übers Ohr hauen. Nämlich dann, wenn man nicht blind vergleicht ...

    Ich habe mit "Foobar2000" den ABX-Vergleichstest mit 100% Trefferquote absolviert.

  • Ok, bei dem kurzen "Fates Warning" Ausschnitt gewinnt für mich auch die 48kHz Version. Aber bei dem anderen kompletten Track kann ich an verschiedenen Stellen keinen Sieger küren.
    Und es könnte ja durchaus sein, dass genau bei dem kurzen "Fates Warning" Ausschnitt die Schallplatten Aufnahme selbst anders klang. Daher ist das für mich keine echte Vergleichsbasis.


    Du kannst gerne zu einem Voting usw. hier einladen.


    Ich will bei Gelegenheit sowieso selbst noch einen Vergleich machen, aber eben mit dem exakt selben Ausgangsmaterial. Dafür fehlen mir z.Z. aber die technischen Möglichkeiten.

  • es könnte ja durchaus sein, dass genau bei dem kurzen "Fates Warning" Ausschnitt die Schallplatten Aufnahme selbst anders klang

    Wie meinst du das? Es wurde im Abstand von wenigen Minuten nur einmal der Tonarm wenige Zentimeter zurückgestellt, sogar ohne daß der Plattenspieler zwischendurch stoppte. In der Zwischenzeit wurde das 48 kHz - Projekt zum recorden geladen, sonstige Bedinungen und Settings waren neutral und identisch. An den Gains (Vinylvorverstärker und DAW-Input-Aussteuerung) wurde nichts verändert -> Input war selbstverständlich derselbe Line-In vom Fireface.

  • Rampen
    D.h. also quasi, dass ein Verzerrer "echter" und "analoger" mit höheren Samplingraten klingt, weil so auch Frequenzen über 20kHz hörbare "Unterschwingungen" erzeugen können?


    Quasi ja, zumindest reagiert er vergleichbarer mit einem rein analogen Verzerrer, vorausgesetzt dass dieser auch höhere Frequenzen als 20kHz verarbeiten kann (was z.B. ein Gitarreneffektgerät vermutlich eher nicht tut).

    Nix da.

  • Wie meinst du das? Es wurde im Abstand von wenigen Minuten nur einmal der Tonarm wenige Zentimeter zurückgestellt, sogar ohne daß der Plattenspieler zwischendurch stoppte. In der Zwischenzeit wurde das 48 kHz - Projekt zum recorden geladen, sonstige Bedinungen und Settings waren neutral und identisch. An den Gains (Vinylvorverstärker und DAW-Input-Aussteuerung) wurde nichts verändert -> Input war selbstverständlich derselbe Line-In vom Fireface.


    Insofern sind das optimale Bedingungen ja. Aber ändert nichts an der Tatsache, dass die Dateien sehr unterschiedlich sind. Ich habe mir den kurzen "Fates Warning" Ausschnitt mal genauer angeschaut. Zunächst hat mein Offline Loudness Analyzer einen Unterschied von 0,1 LUFS bei "Maximum momentary" angezeigt. Nach dem Angleichen der durchschnittlichen Lautheit kam ein Unterschied von 0,03 LUFS Integrated zu Tage. Der lautere Track ist dabei der mit 48kHz. Lauter klingt immer besser, aber obwohl es meiner Argumentation in die Hände spielen würde - 0,03dB sind dafür zu wenig.


    Aber jetzt kommt das große Aaaber - und ich war selbst verblüfft :D
    Als ich den Track Alignen wollte, tat ich mich schwer. Es ging irgendwie nicht. Also alignte ich den ersten Drums Schlag noch mal fast aufs Sample genau (geht ja nicht ganz wegen den unterschiedlichen Abtastraten, aber eben fast). Dann schaute ich mir den letzten Drums Schlag an, der gerade mal 46 Sekunden Abstand zum ersten hat. Dieser Schlag liegt bei der 48kHz Variante ganze 18 Millisekunden vor dem der 44,1kHz Variante! Ich kann gerne Screenshots machen, aber das glaubst du wohl sowieso nur, wenn du es dir selbst anschaust.


    Zudem habe ich in dem anderen längeren Track irgendwie Unterschiede im Stereobild wahrgenommen. Kann auch Einbildung gewesen sein, aber ich tendiere eher dazu, dass ich damit recht habe. Und das spricht weiterhin für die mangelnde "Konstantheit" einer Schallplatten Wiedergabe: Das Stereobild einer Schallplatte hat nämlich so ein paar Eigenarten. Die Kanäle können nicht exakt voneinander getrennt werden und so weiter. Dieser Unterschied kann jedenfalls nicht von der Abtastrate kommen, genau so wie die anderen Unterschiede.


    Denn eine andere Abtastrate macht sich nur bemerkbar, wenn der Anti-Aliasing Filter überhaupt etwas weg schneidet. Ich habe es ja oben genau erklärt: Es dreht sich einzig und allein um das "Rippling", das dadurch entsteht. Und der Unterschied zwischen 44,1 und 48kHz ist seeehr gering. Es könnte sogar sein, dass das Interface den selben Anti-Aliasing Filter dafür benutzt hat (was ich zwar bezweifel). Der würde dann in dem Fall zwischen 20 und 22kHz sowohl bei 44,1kHz als auch bei 48kHz "abfallen".


    Unterschiede machen sich da, wenn die Technik einwandfrei funktioniert, eigentlich wirklich nur bei höheren Samplingraten bemerkbar. Ich meine - das Clipper Plugin, das ich benutze, hat 32x Oversampling. Dagegen sind sogar 192kHz Peanuts.



    Quasi ja, zumindest reagiert er vergleichbarer mit einem rein analogen Verzerrer, vorausgesetzt dass dieser auch höhere Frequenzen als 20kHz verarbeiten kann (was z.B. ein Gitarreneffektgerät vermutlich eher nicht tut).


    Verstehe. Allerdings bräuchte man dafür ja auch eine höher abgetastete Aufnahme. Im Nachhinein würde Oversampling ja nichts bringen, weil der Verzerrer ja so keine nennenswerten Frequenzanteile über 20kHz "zu futtern" kriegt, oder?

  • Ah, da haben wir uns leicht missverstanden: ich meinte zunächst, dass es sinnvoll sein kann, einen Verzerrer mit Audiomaterial mit höherer Bandbreite (und entsprechend höherer Aufnahmesamplingrate) zu füttern.


    Unabhängig davon braucht ein Verzerrer aber in jedem Fall Oversampling (also muss intern mit einer höheren Rate laufen als das Eingangssignal), weil er wie Du schon schreibst auch zusätzliche höhere Frequenzen erzeugt. Und wenn diese überhalb der Nyquistfrequenz liegen, werden sie als grauslich klingende Aliasfrequenzen im Verzerrerausgang auftauchen. Das lässt sich leicht im Experiment prüfen, in dem man einen Sinussweep mal fies ohne schlauere Clippingalgorithmen übersteuert. Anbei ein Originalsweep und der um 10dB geclippte. Da kann man deutlich die Aliasfrequenzen hören.


    *** VORSICHT, LAUT! ***


    Mit Oversampling lässt sich dieses Aliasing reduzieren (ganz weg kriegt man es übrigens dadurch auch nicht).


    EDIT: Seufz, man kann ja keine mp3s anhängen. Also bitte die Endung .txt von den Dateien entfernen.

  • Interessantes Thema!
    Dazu hätte ich eine Frage.
    Ich nehme generell in 48kHz auf. Exportieren das dann auch so und später auch das dazugehörige Video für meine Drum Cover.
    Jetzt schrieb letztens jemand bei Facebook man sollte immer mit der doppelten Frequenz des später exportierten Materials aufnehmen um Rundungsfehler beim runterrechnen zu vermeiden.
    D.h. wenn man später 44,1kHz haben will, sollte man mit 88,2kHz aufnehmen.
    Ist da was dran? Oder nur Voodoo?

  • Ah, da haben wir uns leicht missverstanden: ich meinte zunächst, dass es sinnvoll sein kann, einen Verzerrer mit Audiomaterial mit höherer Bandbreite (und entsprechend höherer Aufnahmesamplingrate) zu füttern.


    Diesbzgl. hatte ich dich schon richtig verstanden ;)


    Zitat von Rampen

    Unabhängig davon braucht ein Verzerrer aber in jedem Fall Oversampling (also muss intern mit einer höheren Rate laufen als das Eingangssignal), weil er wie Du schon schreibst auch zusätzliche höhere Frequenzen erzeugt. Und wenn diese überhalb der Nyquistfrequenz liegen, werden sie als grauslich klingende Aliasfrequenzen im Verzerrerausgang auftauchen. Das lässt sich leicht im Experiment prüfen, in dem man einen Sinussweep mal fies ohne schlauere Clippingalgorithmen übersteuert. Anbei ein Originalsweep und der um 10dB geclippte. Da kann man deutlich die Aliasfrequenzen hören.


    Ich hab mir die Files gezogen und in der DAW angehört und angeschaut. Ist schon erstaunlich, weil das Aliasing ja wirklich eindeutig ist. Ein Verzerrungsplugin müsste allerdings trotzdem ohne Oversampling auskommen, weil intern ein Anti-Aliasing Filter arbeiten kann. Klar ist das Rippling dann bei "normaler" Samplingrate viel stärker, aber Aliasing sollte eigentlich nicht auftreten. Ich denke das ist hier wirklich der Vorgehensweise geschuldet, dass du den Sinus (mittels Fader?) absichtlich Clippen lässt.


    Interessantes Thema!
    Dazu hätte ich eine Frage.
    Ich nehme generell in 48kHz auf. Exportieren das dann auch so und später auch das dazugehörige Video für meine Drum Cover.
    Jetzt schrieb letztens jemand bei Facebook man sollte immer mit der doppelten Frequenz des später exportierten Materials aufnehmen um Rundungsfehler beim runterrechnen zu vermeiden.
    D.h. wenn man später 44,1kHz haben will, sollte man mit 88,2kHz aufnehmen.
    Ist da was dran? Oder nur Voodoo?


    Ich habe oben noch eine Ergänzung zum "Resampling" gemacht. Dort steht, warum da was dran ist. ;)


    Im Startposting steht allerdings auch, warum du eigentlich auch gleich in der Ziel Samplingrate aufnehmen kannst. Youtube empfiehlt übrigens immer noch 44,1kHz und ich gehe davon aus, dass die auch generell "noch" mit dieser Samplingrate arbeiten. Obwohl 48kHz ja eigentlich Standard bei Videos ist.


    Hier mal die offizielle Empfehlung für Musik Videos. Bei der Umsetzung einer PCM bzw. lossless Audiospur im Videoprogramm könnte es aber kniffelig werden (kann dir gern mehr dazu erzählen):


    https://support.google.com/youtube/answer/6039860?hl=de


    Ein rein digitales Resampling ist immer zu vermeiden. Und wenn man es doch macht, sollte man darauf achten, dass der SRC mit der höchsten Qualitätsstufe konvertiert.


    Aber insgesamt gesehen reicht 48 für guten Klang analog-recordingmäßig völlig aus, 44,1 dagegen nmE nicht.


    Das ist gelinde gesagt einfach Blödsinn. 44,1kHz haben gegenüber 48kHz überhaupt keine klanglichen Nachteile. Dass dein Vergleich mit der Schallplatte wegen den zwei verschiedenen Aufnahmen zum Scheitern verurteilt ist habe ich dir in meinem letzten Beitrag erklärt. Aber vielleicht war ich noch zu vorsichtig.
    Die Unterschiede kommen definitiv von der Schallplatten Aufnahme selbst, nicht durch die Quantisierung. Schau dir allein mal das unterschiedliche Tempo an ... 18ms Versatz bei nicht mal einer Minute Laufzeit. Aber das kommt natürlich alles durch die Quantisierung :whistling:


    Und gerade weil 44,1kHz gegenüber 48kHz keine klanglichen Vorteile bietet, ist es noch blödsinniger, in 48kHz aufzunehmen, um anschließend in 44,1kHz zu resampeln. Das Resampling erzeugt dann nämlich den Klangunterschied, nicht die Samplingraten selbst.

  • Dass dein Vergleich mit der Schallplatte wegen den zwei verschiedenen Aufnahmen zum Scheitern verurteilt ist habe ich dir in meinem letzten Beitrag erklärt. Aber vielleicht war ich noch zu vorsichtig.
    Die Unterschiede kommen definitiv von der Schallplatten Aufnahme selbst, nicht durch die Quantisierung. Schau dir allein mal das unterschiedliche Tempo an ... 18ms Versatz bei nicht mal einer Minute Laufzeit. Aber das kommt natürlich alles durch die Quantisierung :whistling:

    Ja nee is klar, Temposchwankungen seitens des Vinylplayers von 18 Millisekunden pro Minute machen den Klang aus, weißt du, gescheit daherreden und meinen man ist ja schon wahnsinnig belesen und deswegen mega weise und hat die Kenne gepachtet ist die eine Sache, die andere ist, wenn man Tests macht und durch Erfahrung seine Schlüsse zieht und wenn man auch mal an sich heranläßt, was andere und vielleicht auch Ältere sagen (sind echt nicht alles komplette Idioten, nee, da gibt es welche mit fundierten Kenntnissen und langjähriger Erfahrung, z.B. der Typ von dem ich den Tipp habe und den ich jetzt nochmal anhaue, damit er dich alten Hasen (hust) mal aufklärt)


    Und gerade weil 44,1kHz gegenüber 48kHz keine klanglichen Vorteile bietet

    Ja nee is auch klar, deswegen hat man ja auch 44,1 so gelassen und 48 ist nicht aufgekommen und etabliert worden, was sollen denn diese 4 kHz Unterschied schon bringen. (muß übrigens umgekehrt sein in deinem Satz: 48 gegenüber 44,1)


    PS: und check mal, wie das wirkt:

    Im Grunde demonstrieren sie nur damit, wie wenig Ahnung sie haben. Das Problem dabei ist allerdings, dass das Thema sehr missverstanden ist und gerade auch viele Audiophile Menschen, die keine "Audioprofis" sind, an "High Res" Audio glauben und sich die dollsten Sachen zusammenreimen

    Damit ist klar, du demonstrierst wie viel Ahnung du hast, du der "Audioprofi". Hmm, überleg mal: kommt nicht so gut. ;)

  • Ich will bei Gelegenheit sowieso selbst noch einen Vergleich machen, aber eben mit dem exakt selben Ausgangsmaterial. Dafür fehlen mir z.Z. aber die technischen Möglichkeiten.

    Ich versteh auch nicht, wie man dahingehend so fest auf seinem vermeintlichen, theoretischen Wissen besteht, obwohl man die Erfahrung noch gar nicht selber gemacht hat... Wenn du den gleichen Test durchlaufen hast (und auch Beweismaterial verschicken kannst) und das Ergebnis deine These untermauert, dann, ja dann erst wäre doch ein Präsentieren von der vielen Ahnung und ein Austausch bzw. eine Diskussion darüber sinnvoll. ;)

  • Ein Verzerrungsplugin müsste allerdings trotzdem ohne Oversampling auskommen, weil intern ein Anti-Aliasing Filter arbeiten kann. Klar ist das Rippling dann bei "normaler" Samplingrate viel stärker, aber Aliasing sollte eigentlich nicht auftreten.


    Das klappt nur, wenn das Anti-Aliasfilter auch die Bandbreite ausreichend weit einschränkt, also man z.B. den Input zum Verzerrer auf ein paar kHz Bandbreite reduziert. Dann hast Du recht, die hohen Frequenzen die der Verzerrer erzeugt sind dann großenteils unterhalb der Nyquistfrequenz. Aber dafür hat man halt ein dumpfes Eingangssignal.


    Oh ja, das Clipping habe ich durch Anwenden eines Boosts in Audacity erzeugt, was das selbe ist wie einfach den Fader ordentlich hochzuziehen (aber ich trau den klassischen DAWs nicht über den Weg, die versuchen ja gerne mal dann doch durch Limiting o.ä. den User vor größerer Fehlbedienung zu bewahren).

    Nix da.

    2 Mal editiert, zuletzt von Rampen ()

  • Ja nee is auch klar, deswegen hat man ja auch 44,1 so gelassen und 48 ist nicht aufgekommen und etabliert worden, was sollen denn diese 4 kHz Unterschied schon bringen. (muß übrigens umgekehrt sein in deinem Satz: 48 gegenüber 44,1)


    Es interessiert vermutlich keinen, aber ich als älterer und in dem Bereich bewanderter "Experte" kann keinen generellen qualitativen Vorteil von 48kHz zu 44.1kHz feststellen. Dass 44.1 aus der Mode gekommen ist liegt nur daran, dass das einzige Medium für das es Relevanz hat (die Audio-CD) eine immer geringere Rolle spielt. Überall sonst waren 48kHz üblich, daher ist das heute der Standard. Die unterschiedliche Flankensteilheit der Anti-Aliasfilter war nur relevant als man noch aufwändige analoge Filter benutzt hat. Heute kommen Wandler mit Oversampling zum Einsatz, wo das keine Rolle mehr spielt.


    EDIT: natürlich gibt es haufenweise Aufnahmen, bei denen 44,1 und 48 verschieden klingen, aber m.E. ist das IMMER ein Unterschied der Wandler bzw. Filter die verwendet werden. Verwendet man hochwertige und vergleichbare Wandler und Filter, verschwindet dieser Unterschied.

    Nix da.

    Einmal editiert, zuletzt von Rampen ()

  • Nick
    Ich habe diesen Thread erstellt, um Wissen zu vermitteln. Wenn du damit ein Problem hast, dann halte dich bitte raus. Es hindert dich keiner daran, einen eigenen Thread für deinen Vergleich zu erstellen.


    Mir ist auch egal, an was du glaubst und was du dir durch deine Tests zusammen reimst. Du kannst meine vermittelten Inhalte hier auch für sonst einen Blödsinn halten, das ist mir auch egal. Nicht egal ist mir wiederrum, wenn man mich provoziert und mich in sinnlose Diskussionen verwickelt. Du hast auch nicht verstanden, warum ich diesen Thread erstellt habe: Ich musste nämlich erkennen, dass es nichts bringt, mit Leuten direkt unter ihren Videos usw. über ihr Halbwissen zu diskutieren. Also habe ich diesen Thread hier erstellt und versucht, das Thema so umfassend und dennoch einfach wie möglich zu beleuchten. Und jetzt kommst du daher, der scheinbar nicht nur Sampling nicht versteht, und verwickelst mich in meinem Thread in ebenso sinnlose Diskussionen über Halbwissen.


    Der Vollständigkeit halber poste ich noch die Videos, die ich erwähnt hatte (ich wollte den Thread eigentlich komplett "clean" von sowas halten, aber ist ja sowieso schon zu spät):


    https://youtu.be/br_KHtR1RAk


    Der bezieht sich wiederrum auf dieses hier:


    https://youtu.be/Iv2OPL9kK0Q


    Glaub, an was du willst, Nick. Aber geh mir nicht damit auf die Nerven.


    PS:
    Sehr interessant finde ich übrigens, dass mir z.B. auf recording.de vorgeworfen wurde, ich würde mir quasi selbst zu sehr vertrauen und hätte ja keine Ahnung, weil ich das nicht richtig gelernt habe. Und hier wirfst du mir jetzt ziemlich genau das Gegenteil vor.


    PPS:
    Ich werde bei Gelegenheit einen eigenen Test durchführen und dafür eine 192kHz Aufnahme mit einem anschließenden "analogen" Resampling in alle Samplingraten darunter bis 44,1kHz machen.


    PPPS:
    Ich hab dann erst mal ne Probe und schreibe später was zu dem Verzerrer Thema.

  • Ich "versteh" mal wieder nur Bahnhof...….weil


    Over....- (über- ) oder Aber auch Unter.....- (under-)…..Laaa…. Laaaa …...la ….aber eins weiss ich gwieeeß!


    Externer Inhalt www.youtube.com
    Inhalte von externen Seiten werden ohne deine Zustimmung nicht automatisch geladen und angezeigt.
    Durch die Aktivierung der externen Inhalte erklärst du dich damit einverstanden, dass personenbezogene Daten an Drittplattformen übermittelt werden. Mehr Informationen dazu haben wir in unserer Datenschutzerklärung zur Verfügung gestellt.



    aber an die Wagenräder in Western, karierte Hemden erinnere ich z.B. Schon. und beschnittene ausgefranzten Polylinien


    Das ist ja wie ein Puzzlespiel mit vielen Teilen, in verschieden Größen wo keiner nicht mal Weiss ob die eigentlich zu einem Bild gehören, und
    welches und wie viele Bilder da draus dann werden sollten und können und, ob die
    dann wirklich noch evtl. in den Bilderrahmen passen, und Ob der wiederum dann noch an die Wand passt.


    Ripping, Clipping, snipping mit der Schere die Verzahnung "richtig" zurechtschneiden, schnell gemacht - aber Wo ist das Ziel, bei welchen Anspruch und bei welchen Gegebenheiten.


    Sein oder Nicht Sein (0 oder 1), Nur zwei Dinge, und dass bei nur einem Auge, bei wieviel Kanälen, wo soll das nur alles rein passen. :) ;)


    Schönen Sonntag und Gruesse

    ich höre immer du musst, du brauchst.....ist "modern", "out", "in", "trendy" und so....
    ich mach`s wie`s mir passt, schei.. auf die Säue, die laufend sinnbefreit durch
    die Dörfer getrieben werden.



Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!