intrinsics

Intrinsische Funktionen werden in kompilierten Sprachen verwendet, um bestimmte CPU-Anweisungen außerhalb des Sprachumfangs zu verwenden.
5
Antworten

Punktprodukt - SSE2 vs BLAS

Was ist meine beste Wette für die Berechnung des Skalarprodukts eines Vektors x mit einer großen Anzahl von Vektoren y_i, wobei x und y_i eine Länge von etwa 10k haben. Schieben Sie die y's in eine Matrix und verwenden Sie eine optimierte s...
07.07.2009, 03:34
3
Antworten

Wie man den Compiler anweist, nicht ausgerichtete Lasten für __m128 zu generieren

Ich habe Code, der mit __m128 -Werten funktioniert. Ich verwende x86-64 SSE intrinsics auf diesen Werten und ich finde, dass wenn die Werte im Speicher nicht ausgerichtet sind, bekomme ich einen Absturz. Dies liegt an meinem Compiler (in dies...
24.11.2015, 09:04
3
Antworten

Initialisierung eines __m128-Typs von einem 64-Bit-Zeichen ohne Vorzeichen

Die _mm_set_epi64 und ähnliche * _epi64-Anweisungen scheinen zu verwenden und hängen von __m64 -Typen ab. Ich möchte eine Variable vom Typ __m128 initialisieren, so dass die oberen 64 Bits 0 sind, und die unteren 64 Bits davon auf x...
05.05.2014, 19:25
2
Antworten

SSE2-Code-Optimierung

Ich verwende SSE2-Intrinsics, um die Engpässe meiner Anwendung zu optimieren, und habe die folgende Frage: %Vor% Beim Microsoft C ++ Compiler wird dies nicht kompiliert, weil die Typen __m128i und unsigned int (übergeben an _mm_sll_ep...
03.11.2011, 13:33
1
Antwort

Was ist der Unterschied zwischen __popcnt () und _mm_popcnt_u32 ()?

MS Visual C ++ unterstützt zwei Varianten der popcnt-Anweisung auf CPUs mit SSE4.2: __popcnt() _mm_popcnt_u32() Der einzige Unterschied, den ich gefunden habe, war, dass die Dokumente für __popcnt() als "Microsoft Specific"...
20.06.2012, 06:32
2
Antworten

Reduzierung der Wahrheitstabelle auf ternäre Logikoperationen, vpternlog

Ich habe viele Wahrheitstabellen mit vielen Variablen (7 oder mehr) und benutze ein Werkzeug (zB logischer Freitag 1), um die Logikformel zu vereinfachen. Ich könnte das mit der Hand machen, aber das ist viel zu fehleranfällig. Diese Formel I üb...
28.11.2017, 17:28
1
Antwort

Vectorizing Modular Arithmetic

Ich versuche, einen einigermaßen schnellen komponentenweisen Vektoradditionscode zu schreiben. Ich arbeite mit 64-Bit-Ganzzahlen (signiert, glaube ich). Die Funktion ist %Vor% Ich kompiliere mit icc -std=gnu99 -O3 (icc, damit ich späte...
16.12.2013, 06:35
2
Antworten

Wie behandeln Compiler SSE (oder andere) intrinsische Funktionen?

Vor einiger Zeit habe ich irgendwo gelesen, dass SSE-Eigenfunktionen zu effizientem Maschinencode kompilieren, weil Compiler sie anders behandeln als gewöhnliche Funktionen. Ich bin am Wandern, wie wirklich Compiler es tun und was C-Programmiere...
15.04.2011, 13:03
2
Antworten

SSE intrinsics - Vergleich if / else Optimierung

Ich habe versucht, einen Code zu optimieren, der rohe Pixeldaten verarbeitet. Derzeit ist die C ++ - Implementierung des Codes zu langsam, also habe ich versucht, einige Gründe mit SSE intrinsics (SSE / 2/3, die nicht 4 verwenden) mit MSVC 2008...
24.01.2012, 12:07
3
Antworten

Test auf Builtins / intrinsics

Ich habe einen Code, der gcc intrinsics verwendet. Ich möchte Code für den Fall, dass der intrinsische fehlt, einfügen. Wie kann ich das tun? %Vor% funktioniert nicht.     
01.12.2010, 08:12