sse

SSE (Streaming SIMD Extensions) war die erste von vielen ähnlich bezeichneten Vektorerweiterungen für den x86-Befehlssatz. Zu diesem Zeitpunkt ist SSE im Allgemeinen häufiger ein Catch-All für x86-Vektorbefehle und kein Verweis auf SSE ohne SSE2, SSE3 usw.
2
Antworten

Warum verwendete Variable zum void verwenden

Ich schaue mir gerade die OpenCV-Implementierung von FAST an und stolperte über einige Variablen, die in void umgewandelt wurden. Ich verstehe, dass dies verwendet wird, um Lint / Compiler-Warnungen zum Schweigen zu bringen, wenn eine Variabl...
18.03.2014, 19:26
2
Antworten

Neon entspricht SSE-Eigenschaften

Ich versuche, einen c-Code zu einem optimierten mit Neon-Intrinsics zu konvertieren. Hier sind die c-Codes, die über zwei Operanden operieren und nicht über Vektoren von Operanten. %Vor% Die SEE-optimierte Version dieser Operation wurde b...
02.07.2012, 11:37
1
Antwort

Kann PTEST verwendet werden, um zu testen, ob zwei Register entweder Null oder eine andere Bedingung sind?

Was können Sie mit SSE4.1 ptest anders machen, als zu testen, ob ein einzelnes Register nur aus Null besteht? Können Sie eine Kombination aus SF und CF verwenden, um etwas Nützliches über zwei unbekannte Eingangsregister zu testen? Wo...
30.04.2017, 23:03
1
Antwort

Permutieren von Bytes innerhalb von SSE __m128i register

Ich habe folgendes Problem: In __m128i register gibt es 16 8bit Werte in folgender Reihenfolge: %Vor% Was ich erreichen möchte, ist, Bytes effizient zu mischen, um diese Reihenfolge zu erhalten: %Vor% Es ist tatsächlich analog zur...
06.07.2014, 10:43
2
Antworten

Wie multipliziert man zwei Quaternionen mit minimalen Anweisungen?

Nach einigem Nachdenken kam ich mit dem folgenden Code zum Multiplizieren von zwei Quaternionen mit SSE: %Vor% Ich habe erwartet, dass die Assembly eine minimale Menge an Anweisungen hat. Wenn ich es jedoch mit gcc -msse3 -S in Assembly ko...
30.08.2013, 23:32
1
Antwort

Stapelausrichtung auf x86

Ich hatte einen mysteriösen Busfehler, der auf einer x86 (32-Bit) -Plattform bei der Ausführung von Code aufgetreten ist, der mit gcc-4.8.1 mit -march=pentium4 kompiliert wurde. Ich verfolgte das Problem auf eine SSE-Anweisung: %Vor% mit...
13.02.2014, 07:57
2
Antworten

Wann profitiert das Programm vom Prefetch & nicht-temporalen Laden / Speichern?

Ich habe einen Test mit diesem gemacht %Vor% Die Ergebnisse sind seltsam. Egal, wie viel Zeit der a_single_chain_computation braucht, die Lade-Latenz ist nicht versteckt. Außerdem erhöht sich die zusätzliche Gesamtzeit, wenn ich meh...
26.06.2013, 06:15
1
Antwort

Hat der Java-Modifikator strictfp irgendwelche Auswirkungen auf moderne CPUs?

Ich kenne die Bedeutung des Modifikators strictfp für Methoden (und für Klassen) gemäß der JLS: JLS 8.4.3.5, strictfp-Methoden:    Der Effekt des Modifikators strictfp besteht darin, alles float oder double zu machen   Ausdrücke inner...
21.03.2014, 15:10
2
Antworten

Akzeptiert XX: UseSE-Werte für Java JVM?

Ich mag Leistung einer Anwendung über mehr SSE-Versionen vergleichen und war nicht in der Lage, die Werte zu finden, die von diesem JVM-Flag akzeptiert werden. Ich teste 0, 1, 3, und 4. Ich bin sehr unsicher, wenn 4 akzeptiert wird (alle Beispie...
05.04.2011, 02:22
1
Antwort

Ist es möglich, SSE (v2) zu verwenden, um eine 128-Bit breite Ganzzahl zu erstellen?

Ich möchte die Fähigkeiten von SSE2 ein wenig mehr verstehen und würde gerne wissen, ob man eine 128-Bit breite Ganzzahl erzeugen könnte, die Addition, Subtraktion, XOR und Multiplikation unterstützt. Danke, Erkling.     
30.08.2012, 15:45