gpgpu, Seitenzahl 2

3

Antworten

OpenCL FFT auf Nvidia- und AMD-Hardware?

Ich arbeite an einem Projekt, das sowohl auf Nvidia- als auch auf AMD-Grafikkarten FFTs verwenden soll. Ich suchte zunächst nach einer Bibliothek, die an beiden funktionierte (ich dachte, dies wäre die OpenCL-Methode), aber ich hatte kein Glück....

03.07.2012, 04:01

2

Antworten

Bandbreite des freigegebenen Speichers Fermi vs Kepler GPU

Hat Kepler 2x oder 4x die Bandbreite von Fermi beim Zugriff auf Shared Memory? Programmierleitfaden-Zustände: "Jede Bank hat eine Bandbreite von 32 Bits pro zwei Takt Zyklen" (für 2.X) und "Jede Bank hat eine Bandbreite von 64 Bits pro Tak...

10.09.2012, 15:13

1

Antwort

Wie vermeidet man die Standardkonstruktion von Elementen in Schub :: device_vector?

Beim Erstellen eines neuen Thrust-Vektors scheint standardmäßig 0 zu sein - ich möchte nur bestätigen, dass dies immer der Fall sein wird. Wenn ja, gibt es auch eine Möglichkeit, den für dieses Verhalten verantwortlichen Konstruktor fü...

05.05.2013, 22:13

2

Antworten

C # Bitmap GetPixel (), SetPixel () in der GPU

Ich benutze Cudafy als c # -Wrapper Ich muss die Farbinformation InputBitmap0.GetPixel(x, y) einer Bitmap erhalten und eine neue Bitmap für die Ausgabe erstellen. Ich brauche folgende Arbeit in GPU. IN CPU %Vor% Kurz gesagt:...

04.02.2017, 07:21

1

Antwort

Unterstützt NVidia OpenCL SPIR?

Ich frage mich, ob nvidia spir backend unterstützt oder nicht? Wenn ja, konnte ich kein Dokument und kein Beispiel dazu finden. aber wenn nicht, gibt es eine möglichkeit, spir backend auf nvidia gpus zu arbeiten? Vielen Dank im Voraus

26.02.2014, 20:45

3

Antworten

physischer Speicher auf AMD-Geräten: lokal vs. privat

Ich schreibe einen Algorithmus in OpenCL, in dem ich jede Arbeitseinheit eine große Menge an Daten speichern müsste, sagen wir etwas zwischen einem long[70] und einem long[200] oder so pro Kernel. Aktuelle AMD-Geräte haben 32 KiB __loc...

17.02.2012, 16:13

2

Antworten

OpenCL AMD vs NVIDIA Leistung

Ich habe einen einfachen Kernel implementiert, bei dem es sich um eine Art Faltung handelt. Ich habe es auf NVIDIA GT 240 gemessen. Es dauerte 70 ms bei CUDA und 100 ms bei OpenCL. Ok, dachte ich, der NVIDIA-Compiler ist besser für CUDA optimier...

23.01.2012, 11:32

1

Antwort

Unterschiede zwischen clBLAS und ViennaCL?

Wenn ich mir die OpenCL-Bibliotheken dort anschaue, versuche ich, jeden einzelnen zu verstehen. Eine Bibliothek ist insbesondere clBLAS . Ihre Website gibt an, dass sie BLAS Level 1,2, & amp; 3 Methoden. Das ist großartig, aber ViennaCL hat a...

26.05.2015, 12:50

1

Antwort

Wie kann SIMD in OpenCL optimal genutzt werden?

Im Optimierungsleitfaden von Beignet, einer Open-Source-Implementierung von OpenCL für Intel-GPUs Arbeitsgruppengröße sollte größer als 16 sein und ein Vielfaches von 16 sein. Da zwei mögliche SIMD-Lanes auf Gen 8 oder 16 sind....

31.10.2015, 14:24

1

Antwort

Wie Debuggen OpenCL auf Nvidia-GPUs?

Gibt es eine Möglichkeit, OpenCL-Kernel auf einer Nvidia-GPU zu debuggen, d. h. Haltepunkte setzen und Variablen überprüfen? Mein Verständnis ist, dass Nvidia-Tool OpenCL-Debugging nicht erlaubt, und AMD's und Intels erlauben es nur auf ihr...

16.08.2013, 03:57