suffix-tree

Ein Suffixbaum ist eine Datenstruktur, die alle Suffixe eines Strings speichert. Es ist die Grundlage für viele schnelle Algorithmen auf Strings.
1
Antwort

Den längsten gemeinsamen Teilstring in einem großen Datensatz finden

In den letzten Tagen habe ich das umfassend recherchiert, ich habe so viele Dinge gelesen, dass ich jetzt mehr verwirrt bin als je zuvor. Wie findet man die längste gemeinsame Sub-Zeichenfolge in einem großen Datensatz? Die Idee besteht darin, d...
17.11.2010, 20:34
1
Antwort

Wie bekomme ich die längste sich wiederholende Zeichenfolge in der Teilzeichenfolge von der Suffixstruktur?

Ich muss die längste sich wiederholende Zeichenfolge in der Teilzeichenfolge finden. Angenommen, ich habe die Zeichenfolge "bannana" Wikipedia sagt folgendes:    In der Informatik ist das längste wiederholte Teilstring-Problem das   P...
16.07.2015, 17:03
3
Antworten

Aufeinanderfolgendes Hinzufügen von char, um das längste Wort im Wörterbuch zu erhalten [geschlossen]

Gegeben ein Wörterverzeichnis und ein Anfangszeichen. finde das längste mögliche Wort im Wörterbuch, indem du nacheinander ein Zeichen zum Wort hinzufügst. In jedem gegebenen Fall sollte das Wort ein gültiges Wort im Wörterbuch sein. Beispiel...
28.03.2010, 18:53
8
Antworten

Effiziente String / Pattern-Anpassung in C ++ (suffixarray, trie, suffixtree?)

Ich suche nach einer effizienten Datenstruktur, um String / Pattern Matching auf einer wirklich großen Menge von Strings durchzuführen. Ich habe von Versuchen, Suffix-Bäumen und Suffix-Arrays erfahren. Ich konnte jedoch bisher keine fertige Impl...
13.11.2012, 16:41
1
Antwort

Suffixbaum Implementierung in Python [geschlossen]

Ich frage mich nur, ob Sie irgendeine C-basierte Erweiterung in Python kennen, die mir helfen kann, Suffix-Bäume / -Arrays in linearer Zeit zu konstruieren?     
24.01.2012, 23:59
3
Antworten

Kurz, Java-Implementierung einer Suffix-Struktur und Verwendung?

Ich bin auf der Suche nach einem kurzen, einfachen Suffixbaum, der in Java verwendet wird. Das Beste, was ich bisher gefunden habe, liegt im Semantic Discovery Toolkit, aber die Implementierung ist mehrere tausend Zeilen lang und umfasst mehrere...
11.01.2010, 15:39
1
Antwort

Teilstringsuche aus einer Zeichenfolge

Eingabe: Zeichenfolge S = AAGATATGATAGGAT. Ausgabe: Maximale Wiederholungen wie GATA (wie in den Positionen 3 und 8), GAT (wie in Position 3, 8 und 13) und so weiter ... Eine maximale Wiederholung ist eine Teilzeichenkette t tritt in S 1...
14.10.2011, 05:36