NLTK Kollokationen für bestimmte Wörter

9

Ich weiß, wie man Bigramm- und Trigramm-Kollokationen mithilfe von NLTK erstellt und sie auf meine eigenen Korpora anwendet. Der Code ist unten.

Ich bin mir aber nicht sicher (1), wie man die Kollokationen für ein bestimmtes Wort bekommt? (2) Hat NLTK eine Kollokationsmetrik basierend auf dem Log-Likelihood-Verhältnis?

%Vor%     
Sabba 16.01.2014, 15:18
quelle

3 Antworten

9

Probieren Sie diesen Code:

%Vor%

Es verwendet das Likelihood-Measure und filtert auch Ngrams heraus, die das Wort 'creature' nicht enthalten.

    
bogs 17.01.2014, 11:54
quelle
2

Frage 1 - Versuchen Sie:

%Vor%

Die Idee ist, alles herauszufiltern, was Sie nicht wollen. Diese Methode wird normalerweise verwendet, um Wörter in bestimmten Teilen des Ngrams herauszufiltern, und Sie können dies nach Herzenslust optimieren.

    
dmvianna 17.01.2014 04:22
quelle
0

Wie bei Frage Nr. 2, ja! NLTK hat das Likelihood-Ratio in seinem Assoziationsmaß. Die erste Frage bleibt unbeantwortet!

Ссылка

    
Sabba 17.01.2014 03:57
quelle

Tags und Links