fma

Fused Multiply Add oder Multiply-Accumulate
1
Antwort

Optimiere für schnelle Multiplikation, aber langsame Addition: FMA und doubleouble

Als ich einen Haswell-Prozessor bekam, habe ich versucht, FMA zu implementieren, um das Mandelbrot-Set zu bestimmen. Der Hauptalgorithmus ist dies: %Vor% Dies bestimmt, ob n Pixel im Mandelbrot-Set sind. Also für Doppel-Gleitpunkt läuft e...
01.06.2015, 12:25
3
Antworten

Wie bekomme ich Daten aus AVX-Registern?

Mit MSVC 2013 und AVX 1 habe ich 8 Floats in einem Register: %Vor% Nun möchte ich inline void print(float) {...} für alle 8 Floats aufrufen. Es sieht so aus, als würden die Intel AVX Intrisics das ziemlich kompliziert machen: %Vor%...
03.06.2016, 10:51