avx2

AVX2 (Erweiterte Vektorerweiterungen 2) ist eine Befehlssatzerweiterung für x86. Es fügt 256-Bit-Versionen von Integer-Anweisungen hinzu (wobei AVX nur einen 256-Bit-Gleitkommawert zur Verfügung stellte).
2
Antworten

Optimaler SIMD-Algorithmus zum Rotieren oder Transponieren eines Arrays

Ich arbeite an einer Datenstruktur, wo ich ein Array von 16 Uint64 habe. Sie sind so im Speicher angeordnet (jede unten repräsentiert ein einzelnes int64): %Vor% Das gewünschte Ergebnis ist, das Array in dieses zu transponieren: %Vor% Di...
19.11.2014, 09:32
1
Antwort

Effiziente Methode, um die ersten N oder letzten N Bits von __m256i auf 1 zu setzen, der Rest auf 0

Wie Sie mit AVX2 auf 1 effizient einstellen können erste N Bits letzte N Bits von __m256i , den Rest auf 0 setzen? Dies sind zwei separate Operationen für Tail und Kopf eines Bitbereichs, wenn der Bereich in der Mitte v...
03.09.2017, 15:16
2
Antworten

Vollständige Nutzung von Pipelines am Kaby Lake

(Weitere Informationen zur Code-Review Fragen ) des Kontexts dieser Schleife.) Umgebung: Windows 7 x64 VS 2017 Community Targeting x64-Code auf Intel i7700k (Kaby See) Ich schreibe nicht viel Assembler-Code, und wenn ich es tue,...
16.07.2017, 05:44
2
Antworten

Ausgerichteter und nicht ausgerichteter Speicherzugriff mit AVX / AVX2-Eigen- schaften

Laut Intels Software Developer Manual (s. 14.9) lockerte AVX die Ausrichtungsanforderungen von Speicherzugriffen. Wenn Daten direkt in eine Verarbeitungsanweisung geladen werden, z.B. %Vor% Die Ladeadresse muss nicht ausgerichtet werden. Wen...
27.06.2015, 13:50