avx

Advanced Vector Extensions (AVX) ist eine Erweiterung der x86-Befehlssatzarchitektur für Mikroprozessoren von Intel und AMD.
2
Antworten

Wählen Sie die eindeutige / Deduplizierung in SSE / AVX

Problem Gibt es rechnerisch machbare Ansätze zur intraregistralen Deduplizierung einer Menge von ganzen Zahlen mit x86 SIMD-Anweisungen? Beispiel Wir haben ein 4-Tupel-Register R1 = {3, 9, 2, 9} und möchten das Register R2 = {3, 9, 2, N...
25.05.2012, 18:54
3
Antworten

Schnelle Speichertransponierung mit SSE, AVX und OpenMP

Ich brauche einen schnellen Memory-Transpose-Algorithmus für meine Gauß'sche Faltungsfunktion in C / C ++. Was ich jetzt mache ist %Vor% Es stellt sich heraus, dass bei dieser Methode die Filtergröße groß (oder größer als erwartet) sein muss...
05.06.2013, 13:22
4
Antworten

fehlt NICHT in SSE, AVX?

Ist es meine Einbildung, oder fehlt eine Anweisung PNOT von SSE und AVX? Das heißt, eine Anweisung, die jedes Bit im Vektor umlegt. Wenn ja, gibt es eine bessere Möglichkeit, es als PXOR mit einem Vektor aller 1s zu emulieren? Ziemlich...
05.03.2017, 20:50
3
Antworten

Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?

Wenn ich SSE3 oder AVX verwenden kann, sind dann ältere SSE-Versionen als SSE2 oder MMX verfügbar - oder muss ich noch separat nach ihnen suchen?     
20.05.2015, 16:39
1
Antwort

Unterschied zwischen Intel E7 und E5 Xeon Modellen? [geschlossen]

Ich untersuche die Möglichkeit, ein Cluster von leistungsfähigen Maschinen zu bauen, die auf HPC (FLOP) -Berechnung ausgerichtet sind, und deshalb habe ich die obersten Intel Xeon-Modelle und war überrascht festzustellen, dass Xeon E7-Modelle...
27.04.2013, 08:30
2
Antworten

Welche Assembler unterstützen derzeit den AVX-Befehlssatz?

Ich möchte mit einigen AVX-Anweisungen (erweiterte Vektorerweiterung) beginnen und spielen. Ich weiß, dass Intel einen Emulator zur Verfügung stellt, um Software zu testen, die diese Anweisungen enthält (siehe diese Frage ), Aber da ich Hex-Cod...
15.11.2009, 15:55
1
Antwort

Ist vxorps-Zeroing auf AMD Jaguar / Bulldozer / Zen schneller mit xmm Registern als ymm?

AMD-CPUs verarbeiten 256b AVX-Befehle, indem sie in zwei 128-Bit-Operationen dekodieren. z.B. vaddps ymm0, ymm1,ymm1 auf AMD Steamroller dekodiert zu 2 Makro-Operationen, mit dem halben Durchsatz von vaddps xmm0, xmm1,xmm1 . XOR-Nullste...
01.05.2017, 01:53
2
Antworten

Notwendigkeit für schnelles Demultiplexen von Daten in C # durch Verwendung von Multithreading, AVX, GPU oder was auch immer

Ich habe eine ziemlich einfache Funktion, die von einer Karte erfasste Daten demultiplext. Die Daten kommen also durch Rahmen, jeder Rahmen, der aus mehreren Signalen besteht, als ein 1-dim-Array und ich muss in gezackte Arrays konvertieren, ein...
14.12.2016, 09:06
3
Antworten

Wie bekomme ich Daten aus AVX-Registern?

Mit MSVC 2013 und AVX 1 habe ich 8 Floats in einem Register: %Vor% Nun möchte ich inline void print(float) {...} für alle 8 Floats aufrufen. Es sieht so aus, als würden die Intel AVX Intrisics das ziemlich kompliziert machen: %Vor%...
03.06.2016, 10:51
2
Antworten

4 horizontale Doppelpräzisionssummen auf einmal mit AVX

Das Problem kann wie folgt beschrieben werden. Eingabe %Vor% Ausgabe %Vor% Arbeit, die ich bisher gemacht habe Es schien einfach zu sein: Zwei VHADDs mit einigen Zwischenmischungen, die aber alle Permutationen von AVX kombini...
31.05.2012, 12:03