LSTM Modell in Keras mit Hilfseingängen

Question

LSTM Modell in Keras mit Hilfseingängen

8

Ich habe einen Datensatz mit zwei Spalten - Jede Spalte enthält eine Reihe von Dokumenten. Ich muss das Dokument in Spalte A mit Dokumenten in Spalte B übereinstimmen. Dies ist ein überwachtes Klassifizierungsproblem. Meine Trainingsdaten enthalten also eine Label-Spalte, die angibt, ob die Dokumente übereinstimmen oder nicht.

Um das Problem zu lösen, habe ich eine Reihe von Features erstellt, sagen wir f1-f25 (indem wir die zwei Dokumente vergleichen) und dann einen binären Klassifikator für diese Features trainiert habe. Dieser Ansatz funktioniert recht gut, aber jetzt möchte ich Deep Learning-Modelle zu diesem Problem (speziell LSTM-Modelle) evaluieren.

Ich verwende die keras Bibliothek in Python. Nachdem ich die Keras-Dokumentation und andere online verfügbare Tutorials durchgelaufen bin, habe ich Folgendes erreicht:

%Vor%

Wenn ich dies jedoch auf den Trainingsdaten punkte, bekomme ich das gleiche Problem. Punktzahl für alle Fälle. Das Problem scheint mit der Art und Weise zu sein, in der der Hilfseingang eingespeist wird (weil er eine sinnvolle Ausgabe erzeugt, wenn ich den Aux-Eingang entferne). Ich habe auch versucht, den Hilfseingang an verschiedenen Stellen im Netzwerk einzufügen. Aber irgendwie konnte ich das nicht zur Arbeit bringen.

Irgendwelche Zeiger?

keras keras-layer

Dataminer 07.05.2017, 07:58

quelle

1 Antwort

Tags und Links keras keras-layer

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Definieren von "globalem" Verhalten in Gulp (Messung der Taskdauer)

score 0 · Answer 1

Nun, dies ist seit einigen Monaten offen und die Leute stimmen ab.
Ich habe kürzlich etwas sehr Ähnliches gemacht, indem ich diesen Datensatz verwendet habe zur Vorhersage von Kreditkartenausfällen und es enthält kategorische Daten von Kunden (Geschlecht, Bildungsniveau, Ehestand usw.) sowie Zahlungsverlauf als Zeitreihe. Also musste ich Zeitreihen mit Nicht-Serien-Daten zusammenführen. Meine Lösung war sehr ähnlich zu Ihrer, indem Sie LSTM mit einem dichten kombinieren, ich versuche den Ansatz für Ihr Problem zu übernehmen. Was für mich funktionierte, sind dichte Layer am Hilfseingang.

Außerdem würde in diesem Fall eine gemeinsame Ebene sinnvoll sein, also werden die gleichen Gewichte verwendet, um beide Dokumente zu lesen. Mein Vorschlag zum Testen Ihrer Daten:

%Vor%

Ich weiß nicht, wie viel das helfen kann, da ich Ihre Daten nicht habe, also kann ich es nicht versuchen. Trotzdem ist das meine beste Chance.
Ich habe den obigen Code aus offensichtlichen Gründen nicht ausgeführt.