nltk.ne_chunk
gibt ein verschachteltes nltk.tree.Tree
-Objekt zurück, so dass Sie das Objekt Tree
durchlaufen müssen, um zu den NEs zu gelangen.
Sehen Sie sich Benannte Entitätserkennung mit regulärem Ausdruck an: NLTK
%Vor% Da Sie einen tree
als Rückgabewert erhalten, sollten Sie diese auswählen Teilbäume, die mit NE
Hier ist ein einfaches Beispiel, um alle in einer Liste zu sammeln:
%Vor%Dies ergibt:
%Vor%oder als Liste von Listen:
%Vor%Siehe auch: Wie navigiert man in einem nltk.tree.Tree?
benutze tree2conlltags von nltk.chunk. Auch ne_chunk benötigt ein pos-tagging welches Word-Token markiert (benötigt also word_tokenize).
%Vor%Damit erhalten Sie eine Liste von Tupeln: [(token, pos_tag, name_entity_tag)] Wenn diese Liste nicht genau das ist, was Sie wollen, ist es sicherlich einfacher, die Liste, die Sie wollen, aus dieser Liste als Nltk-Baum zu analysieren.
Code und Details aus diesem Link ; Weitere Informationen finden Sie unter
Bearbeiten Ausgabedokumentation wurde hinzugefügt
Tags und Links python nlp nltk named-entity-recognition