Das Problem, das Sie zu lösen versuchen, ist bekannt als Anapher Auflösung . Ein Java-Tool zum Ausführen dieser Aufgabe ist hier verfügbar. Der Quellcode wird auf dieser Site verfügbar gemacht. Für einen theoretischen Blick auf, wie es funktioniert, sehen Sie dieses Papier von Lappin und Leass aus 1994.
Suchen Sie nach Korrektionsauflösungswerkzeugen? Es gibt einen kurzen Blog zu einigen der verfügbaren Tools. Die meisten sind in Java wie ArkRef, BART und die im Stanford CoreNLP enthaltene geschrieben.
Hier ist ein weiteres Werkzeug für die Koreferenzanalyse (auch bekannt als Anapherauflösung): Der Pronomen Annotator , die als Teil des GATE -Frameworks verwendet werden müssen.
Tags und Links java weka nlp stanford-nlp