inverted-index

Der invertierte Index ist eine Indexdatenstruktur, die eine Zuordnung von Inhalten wie Wörtern oder Zahlen zu ihren Positionen in einer Datenbankdatei oder in einem Dokument oder einer Gruppe von Dokumenten speichert. Der Zweck eines invertierten Index besteht darin, schnelle Volltextsuchen zu ermöglichen, und zwar auf Kosten einer erhöhten Verarbeitung, wenn ein Dokument zu der Datenbank hinzugefügt wird.
3
Antworten

Die Verwendung von cPickle zum Serialisieren eines großen Wörterbuchs verursacht MemoryError

Ich schreibe einen invertierten Index für eine Suchmaschine für eine Sammlung von Dokumenten. Momentan speichere ich den Index als Wörterbuch von Wörterbüchern. Das heißt, jedes Schlüsselwort wird einem Wörterbuch von docIDs- & gt; Positionen de...
18.02.2011, 03:52