text-mining

Text Mining ist ein Prozess zum Ableiten von qualitativ hochwertigen Informationen aus unstrukturierten (textuellen) Informationen.
2
Antworten

Wie reinige ich Twitter-Daten in R?

Ich habe mithilfe des twitteR-Pakets Tweets aus Twitter extrahiert und in einer Textdatei gespeichert. Ich habe folgendes am Corpus durchgeführt %Vor% (mit mc.cores = 1 und lazy = True, sonst läuft R auf mac in Fehlern) %Vor% Aber die...
10.07.2015, 19:04
5
Antworten

Können Stoppwörter automatisch gefunden werden?

In NLP ist das Entfernen von Stoppwörtern ein typischer Vorverarbeitungsschritt. Und es wird typischerweise in einer empirischen Weise basierend auf dem, was wir denken, Stop-Worte sollten gemacht werden. Aber meiner Meinung nach sollten wir...
13.03.2014, 05:52
2
Antworten

Gibt es Best Practices, um Features für die textbasierte Klassifizierung vorzubereiten?

Wir haben viele Rückmeldungen und Berichte von Kunden. Und sie sind einfache Texte. Wir versuchen, einen automatischen Klassifizierer für diese Dokumente zu erstellen, damit zukünftige Feedback / Probleme automatisch an das richtige Support-Te...
28.02.2014, 05:57
1
Antwort

Die Beziehung zwischen latenter Dirichlet-Zuordnung und Dokumentenclustern

Ich möchte die Beziehung zwischen latenter Dirichlet-Zuweisung (LDA) und der generischen Aufgabe des Dokumentenclusterns verdeutlichen. Die LDA-Analyse tendiert dazu, die Themenanteile für jedes Dokument auszugeben. Wenn mein Verständnis stim...
07.07.2011, 14:17
5
Antworten

So extrahieren Sie nur die Aussagen von Person A in einer Konversation zwischen zwei Personen A und B

Ich habe eine Aufzeichnung von Gesprächen zwischen zwei willkürlichen Personen A und B. %Vor% Der Datenrahmen sieht so aus: %Vor% Nun möchte ich nur den Teil von Person A extrahieren und in einen Datenrahmen einfügen. Das Ergebnis sollte...
23.04.2015, 08:34
3
Antworten

Indizierung und Suche über Annotationsebenen auf Word-Ebene in Lucene

Ich habe einen Datensatz mit mehreren Annotationsschichten über dem zugrunde liegenden Text, z. B. part-of-tags , Chunks von einem flachen Parser , Name entities und andere aus verschiedenen Verarbeitung natürlicher Sprache (NLP) Werkzeuge....
21.05.2010, 14:37
4
Antworten

Abrufen von Daten aus PubMed mit Python

Ich habe eine Liste von PubMed-Einträgen zusammen mit den PubMed-IDs. Ich möchte ein Python-Skript erstellen oder Python verwenden, das eine PubMed-ID-Nummer als Eingabe akzeptiert und dann das Abstract von der PubMed-Website abruft. Bisher b...
01.07.2013, 16:17