cuda

CUDA ist eine parallele Rechenplattform und ein Programmiermodell für Nvidia GPUs (Graphics Processing Units). CUDA bietet eine Schnittstelle zu Nvidia-GPUs über eine Vielzahl von Programmiersprachen, Bibliotheken und APIs.
1
Antwort

Wo sind die GPU-Funktionen auf OpenCV 3.0?

Ich habe verstanden, dass in OpenCV 3.0 die Modul-GPU durch das Modul CUDA ersetzt wurde, oder besser, es wurde in mehrere Module aufgeteilt. So cv::gpu::GpuMat wurde ersetzt durch cv::cuda::GpuMat , gut. Aber was ist mit den Funktion...
13.11.2014, 12:45
2
Antworten

cudamemcpy error: "Der Start ist abgelaufen und wurde beendet"

Mein Code ist eine Parallelimplementation, die die n-te Ziffer von pi berechnet. Wenn ich den Kernel fertig mache und versuche, den Speicher zurück auf den Host zu kopieren, bekomme ich einen Fehler "der Start ist abgelaufen und wurde beendet"....
31.05.2011, 08:53
1
Antwort

Beispiel zum Erhöhen der Arbeit pro Thread in CUDA

Intro : Zuerst und als Einleitung bin ich ziemlich stolz darauf, meine erste Frage zu StackOverflow zu stellen. Ich hoffe, ich werde anderen Menschen genauso helfen können wie sie mir helfen. Algorithmus : Ich schreibe ein Programm mit C...
12.06.2014, 14:31
2
Antworten

Wie gut ist die OpenCV GPU-Bibliothek für Matrixoperationen?

Ich verwende OpenCV für eine Anwendung in der Computer Vision. Ich möchte einige Matrixoperationen (Matrizen sind ziemlich groß) auf GPU beschleunigen und möchte Kodierung, wenn möglich, direkt in CUDA C vermeiden. OpenCV 2.4.1 hat eine Reihe vo...
29.06.2012, 12:40
1
Antwort

CUDA-Gerätestapel und Synchronisation; SSY-Anweisung

Bearbeiten: Diese Frage ist eine re-date-Version des Originals, daher sind die ersten Antworten möglicherweise nicht mehr relevant. Ich bin gespannt, welche Auswirkungen eine Gerätefunktion mit erzwungenem No-Inlining auf die Synchronisation...
11.09.2012, 20:26
1
Antwort

Löse kleine symmetrische positiv definite Ax = b nur auf der GPU

Ich versuche eine Anwendung in Echtzeit-3D-Modellierung zu optimieren. Der Berechnungsteil der Anwendung läuft fast vollständig auf der GPU in CUDA. Die Anwendung erfordert die Lösung eines kleinen (6 × 6) doppeltpräzisen symmetrischen positiv d...
29.07.2012, 17:06
2
Antworten

Gibt es ein benutzerdefiniertes Speicherzuordnungs-Entwurfsmuster, das keine Metadaten in seinen Zuordnungen speichert? [geschlossen]

Im Grunde brauche ich einen Speicherpool für die schnelle Zuweisung kleiner Objekte. Idealerweise möchte ich die Zuordnungen sowohl auf dem Host als auch auf Speicher, die auf GPUs zugewiesen sind, durch cudaMalloc ersetzen. Ich kann meine eigen...
26.01.2015, 15:40
1
Antwort

Abbruch Overhead vs Kontrolle Flag

Ich benutzte eine naive Prim-generierte Funktion. Dieser Code benötigt ungefähr 5,25 Sekunden, um 10k Primzahlen zu erzeugen (device_primes [0] enthält die bereits gefundenen Primzahlen, die verbleibende Position die gefundenen Primzahlen). %V...
05.11.2012, 16:38
3
Antworten

CUDA, wie wählt man Blöcke, Threads?

In einer Bibliothek verwende ich Aufrufe an mehrere CUDA-Kernel. Natürlich möchte ich die beste Leistung erzielen. Wie Benutzer die Bibliothek verwenden, kann ein wenig variieren. Die Anzahl der Blöcke / Threads beeinflusst dies signifikant....
30.09.2012, 09:06
3
Antworten

Bilineare Interpolation zum Vergrößern von Bitmap-Bildern

Ich bin Student und habe die Aufgabe, die bilineare Interpolation von Bildern durch Aufruf von CUDA-Parallelismus zu optimieren. Das Bild wird als 24-Bit-BMP-Format angegeben. Ich habe bereits einen Leser für die .bmp und habe die Pixel in ei...
10.01.2012, 19:06