Ich denke, Sie haben Ihre Antwort in der Mailingliste erhalten, aber ich stelle sie hier für die Nachwelt auf.
Sie können es zufällig initialisieren und anschließend tun: session.run (embedding.assign (my_word2vec_matrix))
Dies überschreibt die Initialisierungswerte.
Das scheint für mich zu funktionieren. Ich glaube trainable=False
wird benötigt, um die Werte fest zu halten?
Sie können den in tensorflow/models/rnn/translate/data_utils.py
vorhandenen Tokanizer ändern, um ein vortrainiertes word2vec-Modell zum Tokenizing zu verwenden. Die Zeilen 187-190
von data_utils.py
:
verwende basic_tokenizer
. Sie können eine tokenizer
-Methode schreiben, die ein vortrainiertes word2vec-Modell zum Tokenisieren der Sätze verwendet.
Tags und Links tensorflow