sse

SSE (Streaming SIMD Extensions) war die erste von vielen ähnlich bezeichneten Vektorerweiterungen für den x86-Befehlssatz. Zu diesem Zeitpunkt ist SSE im Allgemeinen häufiger ein Catch-All für x86-Vektorbefehle und kein Verweis auf SSE ohne SSE2, SSE3 usw.
1
Antwort

SSE Reduktion des Float-Vektors

Wie kann ich mithilfe von sse intrinsics Summenelemente (Reduktion) des Float-Vektors erhalten? Einfacher Seriencode: %Vor%     
20.07.2013, 10:16
4
Antworten

Ist es fair, SSE / AVX-Einheiten mit GPU-Kernen zu vergleichen?

Ich habe eine Präsentation für Leute, die (fast) keine Ahnung haben, wie eine GPU funktioniert. Ich denke, dass eine GPU tausend Kerne hat, wo eine CPU nur vier bis acht davon hat, ist ein Unsinn. Aber ich möchte meinem Publikum ein Element des...
02.07.2013, 13:25
2
Antworten

Qt, GCC, SSE und Stapelausrichtung

Ich versuche, ein Programm zu erstellen, das mit GCC kompiliert wurde und Qt- und SSE-Intrinsics verwendet. Es scheint, dass wenn eine meiner Funktionen von Qt aufgerufen wird, die Stapelausrichtung nicht erhalten bleibt. Hier ist ein kurzes Bei...
05.03.2010, 11:45
3
Antworten

Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?

Wenn ich SSE3 oder AVX verwenden kann, sind dann ältere SSE-Versionen als SSE2 oder MMX verfügbar - oder muss ich noch separat nach ihnen suchen?     
20.05.2015, 16:39
2
Antworten

Optimieren von C-Code mit SSE-Intrinsics

Ich habe eine Weile mit der Leistung der Netzwerkcodierung in einer Anwendung gekämpft, die ich entwickle (siehe Optimierung des SSE-Codes , Verbessern der Leistung der Codierung des Netzwerkcodes und OpenCL-Verteilung ). Jetzt bin ich zieml...
22.10.2011, 16:08
4
Antworten

Fast byteweise ersetzen if

Ich habe eine Funktion, die binäre Daten von einem Bereich in einen anderen kopiert, aber nur wenn die Bytes sich von einem bestimmten Wert unterscheiden. Hier ist ein Codebeispiel: %Vor% Das Problem ist, dass das für meinen momentanen Bedar...
23.02.2016, 13:11
2
Antworten

SSE mit Doppel, nicht wert?

Ich habe ein wenig über die Verwendung von SSE-Intrinsics gelesen und habe mein Glück bei der Implementierung der Quaternion-Rotation mit Doubles versucht. Im Folgenden sind die normalen und SSE-Funktionen, die ich schrieb, %Vor% Mit SSE...
19.01.2013, 16:47
1
Antwort

_mm_shuffle_ps () entspricht für Integer-Vektoren (__m128i)?

Der _mm_shuffle_ps() intrinsic erlaubt es, Float-Eingaben in Low-2-Floats und High-2-Floats des Outputs zu verschachteln. Zum Beispiel: %Vor% führt zu: %Vor% Ich wollte wissen, ob es einen ähnlichen intrinsischen Datentyp für den D...
31.10.2012, 08:05
1
Antwort

Was ist der Unterschied zwischen __popcnt () und _mm_popcnt_u32 ()?

MS Visual C ++ unterstützt zwei Varianten der popcnt-Anweisung auf CPUs mit SSE4.2: __popcnt() _mm_popcnt_u32() Der einzige Unterschied, den ich gefunden habe, war, dass die Dokumente für __popcnt() als "Microsoft Specific"...
20.06.2012, 06:32
2
Antworten

Popcount von SSE-Vektoren für binäre Korrelation?

Ich habe diese einfache binäre Korrelationsmethode, es schlägt Tabellensuche und Hakmem Bit Twiddling-Methoden um x3-4 und% 25 besser als GCC's __builtin_popcount (die ich denke, eine Popcnt-Anweisung zugeordnet, wenn SSE4 aktiviert ist.) Hie...
31.12.2014, 15:11