ptx

Parallele Thread-Ausführung (PTX) ist eine Befehlssatzarchitektur für virtuelle Maschinen, die in der CUDA-Programmierumgebung von Nvidia verwendet wird.
1
Antwort

CUDA-Gerätestapel und Synchronisation; SSY-Anweisung

Bearbeiten: Diese Frage ist eine re-date-Version des Originals, daher sind die ersten Antworten möglicherweise nicht mehr relevant. Ich bin gespannt, welche Auswirkungen eine Gerätefunktion mit erzwungenem No-Inlining auf die Synchronisation...
11.09.2012, 20:26
2
Antworten

Ist es möglich, Montageanweisungen in den CUDA-Code zu schreiben?

Ich möchte Assembler-Code in CUDA C-Code verwenden um teure Ausführungen zu reduzieren wie wir es mit asm in der c-Programmierung machen. Ist es möglich?     
09.09.2010, 13:55