Ich habe in letzter Zeit über diese Frage nachgedacht. Ich habe diese kleine App, die ich gebaut habe, in der ich eine WAV-Datei visualisiere und ihr eine Wellenform gebe (ähnlich wie die Kühnheit).
Ich habe bemerkt, dass es aus irgendeinem Grund negative und positive Werte gibt. Nun, ich kann die Bedeutung von negativen Werten in sinusförmigen Wellen verstehen, wobei die Richtung die Richtung des elektrischen Stroms darstellt. Aber was bedeutet negativer Wert in der Musik?
Sound ist im Grunde genommen eine Druckwelle, die aus "Peaks" besteht, die Bereiche von höherem Druck und "Tälern" sind. das sind Regionen mit niedrigerem Druck. Ein Mikrofon spricht auf die einfallende Druckwelle an, indem es einige physikalische Materialeigenschaften ausnutzt, um diesen Druck über die Zeit zu messen. Eine Aufzeichnung ist der Prozess, bei dem diese Messungen abgetastet und auf einige Medien transkribiert werden.
Eine vernünftige Darstellung ist, den Umgebungsdruck Null zu nennen, wobei höhere und niedrigere Drücke positiv und negativ sind. Eine andere sinnvolle Darstellung besteht darin, den Umgebungsdruck als Halbskala anzunehmen, wobei niedrigere Drücke unter und höhere Drücke über der Hälfte liegen. Andere Darstellungen sind möglich, und es ist nicht einmal erforderlich, dass die Beziehung zwischen dem einfallenden Druck und dem gemessenen Wert linear ist.
Ob eine signierte oder unsignierte Repräsentation verwendet wird, ist nur eine Frage der Geschichte und Konvention. 16-Bit-Audio wird normalerweise als vorzeichenbehaftet dargestellt, aber 8-Bit-Audio ist in der Regel nicht zum Beispiel.
Früher hat das Telefonsystem 8-Bit-Messungen ohne Vorzeichen verwendet, die einer nichtlinearen Funktion folgen, die entweder a-law oder μ-law . Die nichtlineare Darstellung unterstützt einen größeren dynamischen Bereich innerhalb der gleichen Bitrate als eine lineare Darstellung.
Schall ist mechanische Energie in Form von Druckschwankungen in einem elastischen Medium. Diese Druckvariationen breiten sich als Wellen von einer vibrierenden Quelle aus. Änderungen im Luftdruck (Luft ist ein sich ausbreitendes Medium) können durch eine WELLENFORM dargestellt werden, die eine grafische Darstellung eines Schalls darstellt. In Wirklichkeit breiten sich Schallwellen in langen Wellen (und nicht in transversalen Wellen) durch die Luft aus.
Das Konzept der Kompression und Verdünnung kommt ins Bild, wo eine Kompression eine Periode höheren Drucks als der Umgebungsdruck ist (oder wenn die Ausgabe 0 ist) und eine Verdünnung eine Periode ist, in der der Druck niedriger als der Umgebungsdruck ist. Wenn also die Longitudinalwelle auf die Membran des Mikrophons / Wandlers auftrifft. Die Kompression erzeugt einen positiven Wert der Amplitude und die Verdünnung erzeugt einen negativen Wert der Amplitude.
Genau so ... eine Wave-Datei repräsentiert nur eine gesampelte Schallwelle. Und Schallwellen (wie die meisten Wellen jeder Art) liegen manchmal unter und manchmal über dem Gleichgewicht (im Fall einer Schallwelle ist der lokale Luftdruck niedriger oder höher als der Umgebungsluftdruck) und daher sind die Proben manchmal negativ und manchmal positiv.
Am Ende geht es nur darum, ein Gleichgewicht zu finden. Eine 16-Bit-Audiodatei hat Sample-Werte von -32.768 bis +32.767. Sie könnten einfach 32.768 zu allen Abtastwerten hinzufügen und Abtastwerte im Bereich von 0 bis 65.535 erhalten und das Gleichgewicht (totale Stille (in Abwesenheit eines DC-Offsets)) von 0 auf 32.768 verschoben.Die Sample-Werte in einer Sound-Datei können als die Bewegung der Mikrofonmembrane angesehen werden, die zur Aufnahme dieses Sounds verwendet wurde: Die Mikrofonmembran vibrierte oben (positiv) und unterhalb (negativ) ihre Ruheposition (Null).
In ähnlicher Weise bewegt sich die Lautsprechermembran aus ihrer Ruheposition (Null) vorwärts (positiv) und zurück (negativ), um diesen Klang zu reproduzieren. Diese Vibration um eine zentrale Position erzeugt einen Klang.
Aus dem WAV-Format :
8-Bit-Beispiele werden als unsigniert gespeichert Bytes von 0 bis 255. 16-Bit Proben werden als 2er-Komplement gespeichert vorzeichenbehaftete ganze Zahlen von -32768 bis 32767.
Negative Werte ergeben vorzeichenbehaftete Ganzzahlen .
Tags und Links audio