nlp

Natural Language Processing (NLP) ist ein Teilbereich der künstlichen Intelligenz, bei dem nützliche Informationen aus natürlichsprachlichen Daten transformiert oder extrahiert werden. Methoden umfassen maschinelles Lernen und regelbasierte Ansätze.
4
Antworten

Ruby, Zähle Silben

Ich verwende Ruby, um den Gunning Fog Index eines Inhalts zu berechnen, den ich habe. Ich kann den hier beschriebenen Algorithmus erfolgreich implementieren: Gunning Fog Index Ich verwende die folgende Methode, um die Anzahl der Silben i...
13.08.2009, 13:23
3
Antworten

Was ist ein relativ einfacher Weg, um die Wahrscheinlichkeit zu bestimmen, dass ein Satz auf Englisch ist?

Ich habe eine Reihe von Zeichenfolgen (Zeichensätze), die Sätze in verschiedenen Sprachen darstellen, sagen wir:         Hallo, mein Name ist George.           Das Brot ist gut.           ... usw.    Ich möchte jedem von ihnen Punkte (v...
08.02.2013, 04:23
1
Antwort

Python re.split () vs nltk word_tokenize und sent_tokenize

Ich ging diese Frage durch. Ich frage mich nur, ob NLTK schneller wäre als Regex bei der Wort / Satz-Tokenisierung.     
11.02.2016, 17:11
3
Antworten

möchte, dass Regex beim ersten Auftreten von "." und ";"

Ich versuche, einen Satz aus einem Absatz zu extrahieren, mit einem Muster wie %Vor% Wenn ich Regex als verwende %Vor% Dies entspricht der gesamten Zeichenfolge %Vor% Stattdessen möchte ich beim ersten Auftreten von "." zu allen Erfa...
13.06.2014, 11:56
3
Antworten

Wie erhält man die Vergangenheitsform eines Verbs? [geschlossen]

Was ist der effizienteste Weg, um die Vergangenheitsform eines Verbs zu erhalten, vorzugsweise ohne speicherlastige NLP-Frameworks? z.B. leben zu: gelebt versuche es: probiert tippen Sie auf: getappt kochen nach: gekocht verkaufen...
01.03.2012, 16:55
3
Antworten

Python und .NET Integration

Ich schaue mir gerade Python an, weil ich die Textanalyse-Funktionen und die nltk-Bibliothek sehr mag, aber traditionell bin ich ein .Net / C # -Programmierer. Ich denke nicht, dass IronPython ein Integrationspunkt für mich ist, da ich NLTK verw...
24.11.2009, 04:21
4
Antworten

Ermitteln geografischer Orte im Text

Welche Art von Arbeit wurde unternommen, um festzustellen, ob eine bestimmte Zeichenfolge zu einem geografischen Ort gehört? Zum Beispiel: %Vor% Ich vermute, dass ich eine Art statistischen Ansatz erwarte, der ein gewisses Maß an Vertrauen g...
29.07.2009, 15:08
2
Antworten

Zusammenfassung der Textverdichtung - BLEU vs ROUGE

Mit den Ergebnissen von zwei verschiedenen Zusammenfassungssystemen (sys1 und sys2) und den gleichen Referenzzusammenfassungen habe ich sie sowohl mit BLEU als auch mit ROUGE ausgewertet. Das Problem ist: Alle ROUGE-Werte von sys1 waren höher al...
27.06.2016, 03:02
5
Antworten

Regex fügt dem übereinstimmenden String ein Zeichen hinzu

Ich habe eine lange Zeichenfolge, die ein Absatz ist, aber nach Perioden gibt es keinen Leerraum. Zum Beispiel: %Vor% Ich versuche re, um dieses Problem zu lösen, aber die Ausgabe ist nicht das, was ich erwartet habe. Das habe ich gemacht...
11.03.2017, 06:07
3
Antworten

Wie berechnet man die Ähnlichkeit der Buchstabenhäufigkeit?

Angesichts dieser Daten (relative Buchstabenhäufigkeit aus beiden Sprachen): %Vor% Und dann die Berechnung der Buchstabenhäufigkeit für die Zeichenfolge "das ist ein Test" gibt mir: %Vor% Also, was wäre ein guter Ansatz, um die angegeben...
29.03.2013, 19:38