intrinsics

Intrinsische Funktionen werden in kompilierten Sprachen verwendet, um bestimmte CPU-Anweisungen außerhalb des Sprachumfangs zu verwenden.
2
Antworten

Schnelles Berechnen der Hamming-Distanz in C

Ich habe den Wikipedia-Artikel über Hamming Weight gelesen und etwas Interessantes bemerkt:    Es ist also gleichbedeutend mit Hamming distance von der gesamten Null-Zeichenfolge mit der gleichen Länge . Für den typischsten Fall, eine B...
02.08.2014, 20:13
1
Antwort

Kann PTEST verwendet werden, um zu testen, ob zwei Register entweder Null oder eine andere Bedingung sind?

Was können Sie mit SSE4.1 ptest anders machen, als zu testen, ob ein einzelnes Register nur aus Null besteht? Können Sie eine Kombination aus SF und CF verwenden, um etwas Nützliches über zwei unbekannte Eingangsregister zu testen? Wo...
30.04.2017, 23:03
3
Antworten

Wie kann ich einen tragbaren Zeiger vergleichen und tauschen?

Ich habe diesen Code für compareAndSwap in einer StackOverflow-Antwort gefunden: %Vor% Ist dies der geeignetste Weg, um einen portablen schnellen Code zu haben (außer Assembly Inlining). Ein Problem besteht auch darin, dass diese spe...
02.07.2015, 10:19
3
Antworten

Wie bekomme ich eine intrinsische Funktion für die Funktion exp () in x64-Code?

Ich habe den folgenden Code und erwarte, dass die intrinsische Version der Funktion exp() verwendet wird. Leider ist es nicht in einem x64-Build, wodurch es langsamer als ein ähnliches Win32 (d. H. 32-Bit-Build): %Vor% Ich verwende die fo...
10.04.2012, 19:51
1
Antwort

NEON intrinsische Typen arbeiten in C, werfen aber ungültige Argumente in C ++

Ich habe Probleme mit der Verwendung von NEON-Intrinsics und Inline-Assemblierung in Android NDK. NEON-Typen wie float32x4_t geben einen Fehler "ungültige Argumente" beim Kompilieren von C ++ - Code mit GCC 4.6 und 4.8, aber der Code kompi...
27.08.2013, 18:55
1
Antwort

Die beste Methode zum Mischen von 64-Bit-Teilen von zwei __m128i

Ich habe zwei __m128i s, a und b , die ich mischen will, so dass die oberen 64 Bits von a in die unteren 64 Bits von dst fallen und die unteren 64 Bits von b fallen in die oberen 64 von dst . d. h. %Vor% Entspricht: %Vo...
13.08.2014, 18:37
2
Antworten

SSE rundet ab, wenn es aufgerundet werden soll

Ich arbeite an einer Anwendung, die Float-Samples im Bereich von -1.0 bis 1.0 zu 16bit konvertiert, um sicherzustellen, dass die Ausgabe der optimierten (SSE) Routinen korrekt ist. Ich habe eine Reihe von Tests geschrieben, die das non ausführt...
14.10.2015, 01:30