sse2

x86 Streaming SIMD Extensions 2 fügt Unterstützung für gepackte Integer- und Double-Precision-Floats in den 128-Byte-XMM-Vektorregistern hinzu. Es wird immer auf x86-64 unterstützt und ab 2003 auf jeder x86-CPU unterstützt.
4
Antworten

Schnelles Zählen der Anzahl der gesetzten Bits im __m128i-Register

Ich sollte die Anzahl der gesetzten Bits eines __m128i-Registers zählen. Insbesondere sollte ich zwei Funktionen schreiben, die in der Lage sind, die Anzahl der Bits des Registers auf folgende Weise zu zählen. Die Gesamtzahl der gesetzten Bi...
27.06.2013, 23:37
3
Antworten

Wie unter Verwendung von SSE 16-Bit-Ganzzahl durch 255 zu teilen?

Ich beschäftige mich mit der Bildverarbeitung. Ich muss den 16-Bit-Integer-SSE-Vektor durch 255 teilen. Ich kann den Shift-Operator nicht wie _mm_srli_epi16 () verwenden, weil 255 kein Vielfaches von Potenz 2 ist. Ich weiß natürlich, dass...
09.02.2016, 06:28
2
Antworten

SSE2-Code-Optimierung

Ich verwende SSE2-Intrinsics, um die Engpässe meiner Anwendung zu optimieren, und habe die folgende Frage: %Vor% Beim Microsoft C ++ Compiler wird dies nicht kompiliert, weil die Typen __m128i und unsigned int (übergeben an _mm_sll_ep...
03.11.2011, 13:33
1
Antwort

Ist es möglich, SSE (v2) zu verwenden, um eine 128-Bit breite Ganzzahl zu erstellen?

Ich möchte die Fähigkeiten von SSE2 ein wenig mehr verstehen und würde gerne wissen, ob man eine 128-Bit breite Ganzzahl erzeugen könnte, die Addition, Subtraktion, XOR und Multiplikation unterstützt. Danke, Erkling.     
30.08.2012, 15:45