Vektorisierung bezieht sich auf ein Programmierparadigma, bei dem Funktionen auf ganzen Arrays auf einmal ausgeführt werden. Dies bietet Vorteile in Bezug auf Funktionsaufrufe, Speicherzugriff, Parallelisierung und Codeausdruck. Einige Programmiersprachen, wie MATLAB, sind optimiert, um die beste Leistung beim Vektorisieren zu erzielen.
In meinem Arbeitsgebiet (Ökonometrie / Statistik) muss ich häufig Matrizen unterschiedlicher Größe multiplizieren und dann zusätzliche Operationen an der resultierenden Matrix durchführen. Ich habe mich immer auf bsxfun() verlassen, um den Co...
23.05.2015, 04:06
Kontext: Ich habe mehrere Schleifen in einer Objective-C-Bibliothek, die ich schreibe, die sich mit der Verarbeitung großer Text-Arrays befassen. Ich kann sehen, dass es jetzt in einem einzigen Thread läuft.
Ich verstehe, dass LLVM nun in der...
10.11.2013, 13:26
Ich vektorisiere ein Stück Code und irgendwann habe ich folgendes Setup:
%Vor%
Ich packe gerade short s in diese Register, weshalb ich 8 Werte pro Register habe. Was ich tun möchte ist, das i-te Element in b mit dem entsprechenden Wert...
19.06.2015, 16:51
Ich bin neu bei OpenMP und ich versuche, folgenden Code mit OpenMP zu paralelisieren:
%Vor%
Paralelize den äußeren Zyklus ist ziemlich geradlinig, aber um es zu optimieren, wollte ich paralelize den innersten Zyklus (der iterating über i). A...
16.11.2016, 12:09
Ich bin ziemlich neu bei MATLAB. Normale Matrixmultiplikation einer M x K-Matrix mit einer K x N-Matrix - C = A * B - hat c_ij = sum(a_ik * b_kj, k = 1:K) . Was, wenn ich möchte, dass dies stattdessen c_ij = sum(op(a_ik, b_kj), k = 1:K)...
08.11.2011, 22:23
Ich koche gerade eine Wrapper-Container-Template-Klasse für std::vector , die automatisch ein multi-resolution pyramid der Elemente in ihrem std::vector erstellt.
Das Schlüsselproblem besteht jetzt darin, dass ich möchte, dass die Pyr...
06.07.2011, 14:46
Alle modernen GPUs haben eine skalare Architektur, aber Schattierungssprachen bieten eine Vielzahl von Vektor- und Matrixtypen. Ich würde gerne wissen, wie sich Skalierung oder Vektorisierung von GLSL-Quellcode auf die Leistung auswirkt. Lassen...
14.09.2016, 12:47
Ich implementiere einen ultraschnellen Popcount auf Intel Xeon® Phi®, da es ein Performance-Hotspot für verschiedene Bioinformatik-Software ist.
Ich habe fünf Codeabschnitte implementiert,
%Vor%
Eine Zusammenfassung des Codes mit OpenMP-U...
23.04.2013, 08:26
Die Vektorerweiterungen von GCC bieten eine nette, vernünftige Möglichkeit, auf verschiedene SIMD-Anweisungen zuzugreifen Hardwarearchitekturen, ohne auf hardwarespezifische intrinsics (oder Auto-Vectorization) zurückzugreifen.
Ein echter...
16.02.2012, 19:53
Ich versuche den folgenden Code zu vektorisieren:
%Vor%
s.shape = 400 x 100 [gegeben].
a.shape = 400 [erwartet].
s ist eine 2D-Matrix, die die Wahrscheinlichkeit von Paaren enthält.
Es wird erwartet, dass das Multinomial eine Sti...
30.04.2016, 08:02