Caffe | Überprüfen fehlgeschlagen: Fehler == CudaSuccess (2 vs. 0) nicht genügend Arbeitsspeicher

8

Ich versuche ein Netzwerk auf Caffe zu trainieren. Ich habe eine Bildgröße von 512x640. Batch-Größe ist 1. Ich versuche, FCN-8s zu implementieren.

Ich führe dies derzeit auf einer Amazon EC2-Instanz (g2.2xlarge) mit 4 GB GPU-Speicher aus. Aber wenn ich den Solver starte, gibt es sofort einen Fehler aus

%Vor%

Kann mir jemand helfen, von hier fortzufahren?

    
Abhilash Panigrahi 18.11.2015, 21:06
quelle

2 Antworten

15

Der Fehler, den Sie bekommen, ist in der Tat nicht genügend Speicher, aber es ist nicht der RAM, sondern der GPU-Speicher (beachten Sie, dass der Fehler von CUDA kommt).
Wenn Caffe nicht genügend Arbeitsspeicher zur Verfügung hat, müssen Sie als Erstes die Batchgröße reduzieren (auf Kosten der Gradientengenauigkeit ) ), aber da Sie schon bei Losgröße = 1 sind ...
Sind Sie sicher, dass die Batch-Größe 1 für beide TRAIN- und TEST-Phasen ist?

    
Shai 19.11.2015, 06:00
quelle
1

Caffe kann mehrere GPUs verwenden. Dies wird nur in der C ++ - Schnittstelle unterstützt, nicht in der Python-Schnittstelle. Sie könnten cuDNN auch für einen geringeren Speicherbedarf aktivieren.

Ссылка

    
Simon 16.12.2016 19:45
quelle