Tensorflow schlägt fehl mit "Element kann nicht aus dem Feed als Byte abgerufen werden" beim Versuch, den Prüfpunkt wiederherzustellen

8

Ich verwende Tensorflow r0.12.

Ich verwende google-cloud-ml lokal, um zwei verschiedene Trainingsjobs auszuführen. Im ersten Job finde ich gute Anfangswerte für meine Variablen. Ich speichere sie in einem V2-Checkpoint.

Wenn ich versuche, meine Variablen für die Verwendung im zweiten Job wiederherzustellen:

%Vor%

Ich habe die folgende Fehlermeldung erhalten:

%Vor%

Der Checkpoint wird mit diesen Zeilen im ersten Job erstellt:

%Vor%

Laut dieser Antwort könnte dies auf das Fehlen der Metadatendatei zurückzuführen sein, aber ich lade die Metadatendatei.

PS: Ich benutze das Argument clear_devices=True , weil die Gerätespezifikationen, die durch einen Start auf Google-Cloud-ml generiert werden, ziemlich kompliziert sind und ich nicht notwendigerweise dieselbe Dispatch bekommen muss.

    
Thibaut Loiseleur 28.12.2016, 20:12
quelle

3 Antworten

9

Die Fehlermeldung wurde aufgrund der Abwesenheit der Datei "Checkpoint" durch unbeabsichtigte verursacht.

Nach der Wiedereinführung dieser Datei in den entsprechenden Ordner scheint das Laden des Checkpoints zu funktionieren.

Entschuldigen Sie, dass Sie diesen wichtigen Punkt weggelassen haben.

    
Thibaut Loiseleur 04.01.2017, 14:36
quelle
1

Ich denke, das Problem könnte sein, dass Sie beim Speichern des Modells write_meta_graph = False setzen. Daher glaube ich nicht, dass Sie das Diagramm tatsächlich speichern. Wenn Sie also versuchen, es wiederherzustellen, gibt es kein zu aktualisierendes Diagramm. Versuchen Sie es mit write_meta_graph = True

    
Jeremy Lewi 29.12.2016 15:34
quelle
-1

Die Fehlermeldung war auch auf die Fehler in der Datei mit dem Namen "Checkpoint" durch Unachtsamkeit zurückzuführen.

Zum Beispiel wurde der Ordner, der die Modelle enthält, verschoben, aber der Wert von "model_checkpoint_path:" in "checkpoint" ist immer noch der alte Pfad.

    
bob sherlock 24.10.2017 08:17
quelle