Ich möchte ein Diagramm mit dem Tensorflow-Werkzeug transform_graph optimieren. Ich habe versucht, den Graphen von MultiNet zu optimieren (und andere mit ähnlichen Encoder-Decoderarchitekturen). Allerdings ist das optimierte Diagramm bei Verwendung von quantis_weights tatsächlich langsamer und bei Verwendung von quantise_nodes sogar sehr viel langsamer. In der Tensorflow-Dokumentation gibt es möglicherweise keine Verbesserungen oder sogar eine langsamere Quantisierung. Irgendeine Idee, wenn das mit dem Diagramm / der Software / Hardware unten normal ist?
Hier finden Sie meine Systeminformationen als Referenz:
Ich kann alle erforderlichen Skripts posten, falls nötig.
Es scheint, als würde die Quantisierung in Tensorflow nur auf CPUs stattfinden. Siehe: Ссылка
Ich habe das gleiche Problem in der PC-Umgebung. Mein Modell ist 9 mal langsamer als nicht quantisieren.
Aber wenn ich mein quantisiertes Modell in eine Android-Anwendung portiere, ist es in Ordnung, es zu beschleunigen.
Scheint wie aktuell nur auf CPU und nur ARM Basis-CPU wie Android-Handy zu arbeiten.
Tags und Links tensorflow tensorflow-gpu