Fourier Domain - habe ich meine Theorie / Terminologie richtig verstanden? [geschlossen]

8

In Bezug auf Bilder.

Die Fourier-Transformation wandelt die räumliche in die Frequenz (Fourier) -Domäne um. DC-Wert = Durchschnitt der Sinuskurven (Sinuswellen), F (0,0) und durchschnittliche Helligkeit / Graustufen des Bildes. Fourier hat eine komplexe Zahlenausgabe .... Sie können die [Größe und Phase] oder [echte und imaginäre] Ausgaben erhalten.

Was ich nicht verstehe, ist, was die komplexe Zahlenausgabe tatsächlich darstellt, wenn Sie FFT machen? Ich weiß, ein Bild im Fourier-Bereich ist die Summe der gewichteten Sinuswellen, aber was bedeutet die Ausgabe eigentlich.

Was ist räumliche Frequenz? Wenn ich mir Definitionen anschaue, wird sie als Änderungsrate der Pixelwerte angegeben. Was bedeutet das?

    
Cheetah 04.05.2011, 22:57
quelle

3 Antworten

2

Sie können es also besser visualisieren, wenn Sie die komplexe Zahleninformation auf einen Betrags- und Phasenwert parametrisieren, es gibt die Größe der Frequenzkomponente an und die Phase gibt Ihnen die Position der Komponente im Bild.

Die räumliche Frequenz bezieht sich normalerweise auf die Änderung des Intensitätswerts, wenn Sie durch die Pixel ziehen. Eine Kante in Ihrem Bild würde aufgrund der starken Änderung der Pixelwerte eine hohe räumliche Frequenz aufweisen.

    
jajo87 04.05.2011, 23:48
quelle
3

Die Ausgaben mit komplexen Zahlen geben die Größe und Phase der verschiedenen Fourier-Basisvektoren / Signale an.

Im Falle eines eindimensionalen Signals, z.B. Audio sind diese Basisvektoren komplexe Sinusoide, die sich um den Einheitskreis mit unterschiedlichen (räumlichen) Frequenzen (die ganzzahlige Vielfache der Grundfrequenz sind) mit fortschreitender Zeit drehen.

Im Falle eines Bildes sind die Basisvektoren zweidimensionale (komplexe) Planeaves. Jetzt können die Komponenten auch unterschiedliche Richtungen haben. Jedes Pixel im Fourier-Raum entspricht also einer bestimmten Kombination aus Richtung und Frequenz. Einfach gesagt, die Richtung und Frequenz einer Planewave in der Raumdomäne, die in der oberen linken Ecke beginnt, beendet eine volle Periode, bis sie die Position des entsprechenden Fourier-Domain-Pixels erreicht (auf die direkteste Weise).

Um eine reellwertige Sinus- oder PlaneWave zu modellieren, werden zwei komplexe Basisvektoren mit Frequenzen gleicher Größe aber negativer Frequenz so überlagert, dass sich ihre Imaginärteile aufheben.

    
Thies Heidecke 05.05.2011 13:13
quelle
1

Das Ergebnis ist komplex, weil die Sinusoide eine Mischung aus orthogonalen Sinuswellen und Kosinuswellen sein können, und eine komplexe Zahl ist eine mathematisch schöne Art, diesen Sinus + Kosinus-Mix darzustellen.

Denken Sie an einen Lattenzaun mit gleichmäßig verteilten Pfosten über ein gesamtes Bild. Die Ortsfrequenz ist die Anzahl der Streikposten über das Bild (horizontal oder vertikal). Versetze den Lattenzaun im Bild um eine halbe Latte (ein Viertel der Periodizität) und der Zaun könnte zwischen einer eher sinusförmigen und einer kosinusförmigen Welle wechseln. Die Darstellung der komplexen Zahlen wird sich drehen.

Was ist das? Fouriers überraschende Theorie ist, dass jedes Bild (abgesehen von einigen perversen mathematischen Konstruktionen) durch eine Reihe von orthogonalen Raumfrequenz-Sinusoiden repräsentiert oder dekonstruiert werden kann. (Jedes Bild. Nicht nur Bilder von Lattenzäunen!) Nachdem Sie Bilder in Frequenzen umgewandelt haben, können Sie alle Arten von DSP auf ihnen, ähnlich wie Audio-Verarbeitung oder Filterung, und dann zurück konvertieren.

    
hotpaw2 05.05.2011 16:42
quelle