Peak im pos. dB-Bereich - das geht?

  • Nanu ...


    ich dachte, in der digitalen Welt würde alles über 0db abgeschnitten und zumindest bei professionellen Aufnahmen würde der Heilige Limiter ein wachsames Auge auf die Grenze haben. Nun habe ich schon viel über Loudness War und Clipping gelesen, dachte aber bei 0db sei halt technisch schicht.


    Um mich dem Thema RMS zu nähern, habe ich mir gerade verschiedene alte und neue Aufnahmen angesehen und siehe da: Bald jede neuere Aufnahme kommt im Peak-Bereich auf Pluswerte. Ich dachte zunächst, ich hätte meine Software (Reaper als DAW) irgendwie falsch eingestellt, aber auch Audacity zeigt eindeutig jede Menge Übersteuerungen (rot). Was ist da los? Ist "übersteuern" einfach normal? Ist falsch also neuerdings richtig? Oder mach bzw. verstehe ich was falsch?


    Hier am Beispiel "Musicology" von Prince:


    Daten des Schwa Audio-Statistics Plug-In in der Reaper-DAW:




    Und hier der unschöne Anblick in Audacity:




    Verwirrte Grüße
    Hajo K

  • Haha! Super Thema! Das wird das Forum sprengen. :thumbup: Aber besser hier, als in den Recording-Spezial-Foren, wo man sofort ausflippen würde.


    Also: das ist so…..
    :whistling:


    (Edit: hier hatte ich die Frage noch nicht richtig gelesen)


    0dB ist ein Referenzwert. Der sagt nichts über eine Lautstärke oder ähnliches aus, ohne das dazu irgend eine Referenz gegeben wäre, an der sich die 0 dB messen. z.B. RMS. Am Ende ist das ein Wert, an dem die Wandler wissen, wieviel Leistung sie dann abgeben.


    Dann gibt es digitale Abtastsysteme für Audiodateien - PCM ist das gängige. Diese haben unterschiedliche Wortbreite (zuständig für den Dynamikumfang) z.B. 16 Bit, 24 Bit….. Und unterschiedliche Samplerate (zuständig für die höchste Frequenz, die abgetastet werden kann) z.B. 44,1 KHz oder 48 KHz.


    Wenn man nun eine CD nimmt, dann sind darauf Audio-Dateien mit 16-Bit und 44,1 KHz - 16 Bit = nicht der höchste Dynamikumfang. In einer DAW wird intern oft mit mehr gearbeitet: z.B. schon 24 Bit bei der Aufnahme - eine voll ausgesteuerte 24-Bit Datei kann man also nicht einfach durch Abschneiden der letzten 8 Bit (=truncation) in 16-Bit umwandeln - sie muss durch die Audio-Engine der DAW, wo sie auf einen Referenz-dB-Wert gerechnet wird, sonst wird es nur verzerrt.


    Nun ist es aber auch so, dass Audio-Kanäle auch in der DAW beim Zusammenmischen höhere dB-Werte erzielen, weil sich die Pegel aufaddieren. (z.B. zwei zusammen gemischte Pegel von -3dB kommen auf 0 dB ) - damit das nicht zur Katastrophe führt, wird innerhalb der DAW mit höherer Dynamik gerechnet. in modernen Audio-Engines mit bis zu 64-Bit (gängig 32-Bit-floatng-point (Pro-Tools-Native) oder 48 Bit.fixed-point(Pro-Tools-TDM).


    Innerhalb der DAW kann es also lauter werden, als die Referenz von 0 dB - man spricht da auch in diesem Zusammenhang von Headroom. Wenn man dann exportiert, muss man aufpassen - sonst wird es zu heiß, denn da ist 0 dB der Wert, den die Datei höchstens verträgt, in die man umrechnet.


    Das war jetzt stark vereinfacht - möglicherweise hier und da unpräzis - aber die Frage dürfte in etwa beantwortet sein. 8o


    Edit: nach dem genauen Lesen der Frage: RMS ist auch ein Durchschnittswert - das bedeutet, dass die Spitzen auch mal drüber sind.

  • Ich nehm grad bisschen was auf, da fällt mir das in Studio One auch andauernd auf.
    Selbst wenn ich Clipping habe, clippt es nicht :D Es wird also im roten Bereich angezeigt, aber das fürs Ohr hörbare Übersteuern was man so kennt, kommt erst ab hohen +db Werten. (So ab 6db im DAW würd ich sagen?)

  • RMS ist KEIN Referenzwert, sondern ein Mittelwert von einem Pegel. dbFS hat einen Referenzwert, und dies ist die Wortbreite. Positive dbFS-Werte können nur in höher auflösenden Umgebungen dargestellt werden, wie sie praktisch jede DAW darstellt. In einem 24 Bit Projekt bedeutet ein Pegel von +6 dbFS etwa eine effektive Auflösung von 25 BIt (ca. 6 dB pro Bit).


    Wie Reaper daraus jetzt aber die Peaks ableitet, ist nicht ganz klar. Ich vermute es leitet das aus der Wellenform ab und interpoliert dann zwischen den Maximalwerten die "originale", unlimitierte Wellenform. Das kann ich aber aus der Ferne auch nur vermuten, müsste man mit diversen Referenzdateien rausknobel wie das genau funktioniert.

    "I've got a fever, and the only prescription is more cowbell!" - Bruce Dickinson

  • dbFS hat einen Referenzwert, und dies ist die Wortbreite. Positive dbFS-Werte können nur in höher auflösenden Umgebungen dargestellt werden, wie sie praktisch jede DAW darstellt. In einem 24 Bit Projekt bedeutet ein Pegel von +6 dbFS etwa eine effektive Auflösung von 25 BIt (ca. 6 dB pro Bit).


    dBFS steht für dB bezogen auf den technisch möglichen digitalen Vollpegel (=Fullscale) in einem System - dieser Wert kann maximal 0dB sein. Bei 0dBFS ist jedes Bit mit einer 1 gefüllt - mehr geht dann rein technisch nicht mehr. Wenn an einem Pegelmeßgerät dBFS steht und der Pegel einen Wert höher als 0dB annimmt, dann ist etwas faul.


    Dein Beispiel ist nur so denkbar, dass in einem System, dass z.B. intern mit einer 32Bit floating Auflösung arbeitet (und damit einen Dynamikbereich von etwa 1000dB hat), mehrere 24-Bit Spuren zusammen einen Peak ergeben können, der bezogen auf 0dBFS im 24-Bit-System höher als Null liegt. Wenn aus diesem System aber eine 24Bit-Datei exportiert, dann ist der höchste darin vorkommende Pegel 0dBFS - mehr geht nicht (wie auch - bei 24 Einsen hintereiander ist für rein garnichts mehr Platz). Die Stellen, die vorher im 32-Bit System über den 0dBFS (24-Bit) lagen, sind dann hart geclippt, also oben abgeschnitten.


    Edit: zur Ausgangsfrage nochmal - wenn das Signal sauber von einer CD importiert wurde (also digital ausgelesen wurde), dann sind die angezeigten Werte nicht möglich - jedenfalls, wenn der Peak-Wert digital berechnet wird und nirgendswo im System eine Anhebung des Pegels stattgefunden hat. Ich würde dem Gespann Reaper/Plugin da nicht trauen.. bei mir in Samplitude ergibt jede noch so Loudness-Optimierte CD nach dem Import einen Pegel von max. 0dB(FS), so wie es sein soll und muss...

  • Hi,
    ich hab keine Ahnung von dem Recordingkram aber bevor das hier ausartet und unübersichtlich wird:


    RMS ist NICHT der Mittelwert sondern der Effektivwert (U_RMS = ). Das ist ein Riesenunterschied weil der (arithnmetische) Mittelwert eines Sinussignals Null ist. Trotzdem pfeifts in den Ohren.


    Außerdem ist ein Word in der Digitaltechnik immer 16 Bit also 2 Byte.


    Ein bisschen On-Topic:
    Bei der Lautstärkepegelmessung gibt 0db als Referenz die Hörschwelle des Ohres an.


    db errechnen sich als U_db = 10 * log (U1/U2), wobei U1 der aktuelle Wert und U2 der Vergleichswert ist. D.h. entspricht der aktuell gemessene Wert der Referenz, ergibt sich 0db.
    Bleibt nur die Frage was im Recordingbereich als Vergelichswert genommen wird.


    *Klugscheißmodus beendet* ;)

  • 0db ist nicht die hörschwelle des ohres bei Lautstärkepegelmessung.
    0db ist das ergebnis einer willkürlichen festlegung von p0= 2*10^-5 Pa schalldruck in der formel
    20 * log p/p0 für den aktuellen schalldruck p der in Pascal = N/m^2 angegeben wird.


    Die hörschwelle des menschen ist frequenzabhängig.
    bei 1khz liegt die höschwelle im schnitt bei 6db.
    Bei ca. 4khz ist das ohr am empfindlichsten. Da kann die hörschwelle schonmal unter 0db liegen...


    *verbesserung des klugscheissmodus off*

  • Solange das Projekt in Fließkomma läuft ist die Anzeige 0 dB meist "willkürlich". Mit 32 Bit Fließkomma mit einer 8 Bit Mantisse kann man über 1500 dB darstellen. Am Ende wird die Dynamik aber wieder auf 96 bzw. 144 dB eingeschränkt (16 Bit bzw. 24 Bit Festkomma), es macht also nicht viel Sinn die Pegelanzeige auf 0dBFS der Fließkommazahl auszulegen.


    Erst wenn auf 16- oder 24-Bit Festkomma umgerechnet wird, ist die Umrechnung entscheidend. Damit keine Übersteuerungen auftreten sollte logischerweise der höchste Fließkomma-Wert dem maximalen Festkommawert entsprechen.


    Keine Ahnung wie die verschiedenen DAWs das machen bzw. was man einstellen muss damit richtig umgewandelt wird.



    Außerdem ist ein Word in der Digitaltechnik immer 16 Bit also 2 Byte.


    Die Wortbreite gibt die Grunddatengröße eines Systems an. Ein 4 oder 8 Bit-Prozessor hat auch nur 4 bzw. 8 Bit Wörter, ein 64-Bit Prozessor rechnet mit 64 Bit Wörtern. Ein Wort kann beliebig groß sein.


    0db ist das ergebnis einer willkürlichen festlegung von p0= 2*10^-5 Pa schalldruck in der formel

    Nein, Willkürlich war das nicht. Das hat man anhand Hörversuchen festgelgt. Nur hat man später bemerkt dass der Wert für 1kHz gar nicht so zutrifft. Das war dann schon irgendwie willkürlich den Wert trotzdem so zu belassen und nicht anzupassen.
    p0 ist übrigens als RMS-Wert festgelegt, d.h. Schallpegel ist immer ein Effektivwert.

    Ich hätte auch so gern ein Hobby...

  • Ganz herzlichen Dank für die Antworten ... die ich in den nächsten 96 Monaten nachzuvollziehen suche. :) Aber ein paar Anhaltspunkte habe ich, auf denen ich jetzt weiter rumkauen kann.



    Erkennbar eine komplexe Thematik, bei der man wohl schnell auf Holzwege kommt. Ich merke, ein gesundes Fundament in Physik könnte helfen. Tja, ich schreib meinem alten Physiklehrer gleich mal eine reuevolle Mail. :D


    Nochmal danke und viele Grüße
    Hajo K

  • Wenn Du Dich wirklich noch ein bisschen mit Pegeln beschäftigen möchtest kann ich Dir dieses PDF empfehlen:
    http://dl.dropbox.com/u/393335/Pegelrechnung.pdf


    Da wird alles sehr anschaulich Schritt für Schritt erklärt, geht konkret thematisch aber eher Richtung HF-Übertragung, die Prinzipien sind aber die gleichen. Bei dbFS ist der Bezugswert, wie jetzt schon mehrmal wiederholt wurde, die eingestellte Wortbreite. -6 dbFS bedeutet also noch 6 dB bis alle Bits ausgeschrieben sind.


    EDIT: nur nebenbei, ich habe nicht behauptet RMS ist DER Mittelwert, sondern EIN Mittelwert. :rolleyes: Effektivwert wäre aber natürlicher trotzdem korrekter gewesen... :whistling:

    "I've got a fever, and the only prescription is more cowbell!" - Bruce Dickinson

  • Heureka!


    Ich hab's: Für die Messung hatte ich ein MP3 (192er) genutzt, nun weiß ich, dass MP3s unter Umständen höhere Pegel mit sich bringen.
    Christian Schubert hat das in seinem interessanten Artikel über Headroom und Aussteuerungsreserve beschrieben:


    Zitat

    "Fazit: Datenreduktionsalgorithmen benötigen zum fehlerfreien Arbeiten einen gewissen Headroom. Dieser ist vergleichsweise gering (gefunden wurden Werte bis 0,2 dB ), nimmt aber dramatisch zu, wenn der Codec mit geclipptem Audiomaterial gefüttert wird. Bitte daran erinnern: „Geclippt“ (auf „quasi-analoger“ Ebene) ist unter Umständen auch Material, das mit der Normalisierungsfunktion behandelt wurde!"


    Wieder was gelernt und gleich überprüft - siehe da:




    Die Welt ist also wieder in Ordnung. ^^
    Erfreute Grüße von
    Hajo K

  • Moin,


    ich möchte hier mal nachhaken. Angenommen das Audiomaterial welches in einer 32Bit Fliesskomma DAW verarbeitet wird ist in 16 Bit aufgelöst (die Projekteinstellung ist auch 16 Bit) und die Pegelanzeige der DAW Spuren zeigt mir z.B. +1 dBFS an, dann bezieht sich dieser Wert auf die Vollaussteuerung einer 16 Bit Auflösung und beim Export mit diesen 16 Bit käme es zum Clipping. Innerhalb der DAW ist das jedoch unproblematisch da ja mit 32 Bit gearbeitet wird.
    Demnach muss ich mir bei den genannten +1 dBFS während des Arbeitens in der DAW keine Gedanken machen aber darauf achten, dass beim Export in 16 Bit die 0dbFS sicher nicht überschritten werden.
    Habe ich das so richtig geschnallt?


    Grüsse

    Blaukraut bleibt Blaukraut & Brautkleid breibt Blaubtkreid

  • Zitat

    Demnach muss ich mir bei den genannten +1 dBFS während des Arbeitens in der DAW keine Gedanken machen aber darauf achten, dass beim Export in 16 Bit die 0dbFS sicher nicht überschritten werden.


    Ja, genau. Solange Du Dich in einer > 16bit Umgebung befindest, ist das alles kein Problem. Erst beim Export wird sich bei Signalen > 0dB ein Clipping ergeben.


    Es gibt aber zudem noch den Effekt des Inter-Sample-Clippings, der sich erst bei Analogisierung eines digitalen Signales ergibt. Digital wird ein Audiosignal als Fliesskommazahl dargestellt. 0dB ist dabei der Wert 1,0, -6dB ist etwa 0,5, -12dB etwa 0,25 usw. In 32bit-Umgebungen kann man problemlos auch 2, 20 oder 50 haben, ohne dass es clippt, bei der Konvertierung zu 16bit würde es aber in harschem Clipping enden. Stellen wir uns jetzt eine Schwingung vor, bei der zwei aufeinander folgende Samples den Wert 1 haben, würde bei der Wandlung ins Analoge, was ja keine "Auflösung" hat (analog eben), zwischen den beiden Samples mit ziemlich hoher Wahrscheinlichkeit Werte über 1 heraus kommen. Das nennt man Inter-Sample-Clipping. Das Bild im Anhang zeigt die Samples, dann das Signal, wie es ein Wandler eigentlich erzeugen müsste, und dann das Signal, was wirklich aus dem Wandler kommt.


    Sprich: Auf der digitalen Ebene ist alles "nach Vorschrift", kein Wert über 1, also 0dB. Folgt der Wandler den Samples, würde es über 0dB gehen, geht in der Praxis nicht, also wird das tatsächliche Signal nicht-linear verzerrt.


    Um das in den Griff zu bekommen, wurden "damals" digitale Aufnahmen auf irgendwas zwischen -0,1 und -0,3 dB gemastert, heute nimmt man im Masteringprozess einfach Plugins, die intern Oversampling betreiben. Jeder ernstzunehmende Mastering-Limiter macht das mittlerweile. Damit fügt man in der Signalbearbeitung Samples zwischen den eigentlichen Samples ein, so dass der Limiter das resultierende Signal auf tatsächliche 0dB, also 1, bringen kann, ohne, dass man den gesamten Signalverlauf auf z.B. 192kHz laufen lassen muss.


    tl;dr: Hast Du intern exakte 0dB und benutzt keinen Masteringlimiter am Ende, stelle den Masterfader vor dem Export lieber auf -0,2dB. Fügst Du so einen Limiter in den Masterkanal ein, kann es Dir egal sein.

  • Das Bild im Anhang zeigt die Samples, dann das Signal, wie es ein Wandler eigentlich erzeugen müsste, und dann das Signal, was wirklich aus dem Wandler kommt.


    Wobei ein vernünftiger D/A-Wandler durchaus das gewünschte Signal erzeugen kann. Nur wenn der Wandler nicht ausreichend Headroom bietet (was besonders bei Billig-Wandlern der Fall ist), entstehen die dargestellten Verzerrungen. Hilft aber nix, da man ja nicht weiß, auf welchen Geräten die Musik später abgespielt wird ^^ .

    Nix da.

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!