Unter Lucene / Solr, Whoosh, Sphinx, Xapian, welches sich am besten mit Python verbindet? [geschlossen]

8

Ich bin ein Newb-Coder in einem Startup und ich implementiere die Suche von Dokumenten in einem Verzeichnis in einem Web-Host.

Ich vergleiche Lucene / Solr, Whoosh, Sphinx und Xapian. Whoosh ist nativ Python. Aber ich möchte auch Ihre Meinung dazu. Welche davon haben

  • ausgereift und einfach zu bedienen und zu installieren Schnittstellen mit Python? (Whoosh ist ein Kinderspiel)
  • keine Chance für Abstürze, Engpässe und andere Ausfälle
  • am besten dokumentierte Schnittstelle (Ich lese keine PHP-Dokumente, weil Python-Dokumente spärlich waren)
  • am einfachsten aufzustehen (nur einer hat eine Schnellstartanleitung)
aitchnyu 17.07.2011, 15:04
quelle

3 Antworten

2

Apropos Apache Solr, Python hat mehrere Solr-Clients , die ich aufgrund von Feedback von unseren Kunden gesammelt habe Websolr :

  1. Heuhaufen ist sehr beliebt und wurde für die nahtlose Integration in Django-Apps entwickelt. Wenn Sie eine Django-App entwickeln, ist Haystack genau das Richtige für Sie.
  2. Sonnenbrand scheint generischer zu sein als Heuhaufen und ist auch sehr gut dokumentiert. Wenn du schlicht ol 'Python machst, ist Sunburnt einen Blick wert.

Andere Python Solr-Clients, die ich gefunden habe, scheinen etwas niedriger zu sein ...

Einige weitere Details dazu, wie Ihre App aufgebaut ist (insbesondere, ist es eine Django-App?) würden dazu beitragen, die Dinge von hier aus einzugrenzen. Viel Glück bei der Suche nach der besten Lösung für Ihre App!

    
Nick Zadrozny 26.07.2011, 19:42
quelle
2

Verwenden Sie Whoosh, wenn Sie die Geschwindigkeit nicht benötigen, zusätzliche Funktionen der Alternativen. Es ist großartig, hat eine nette API, gute Dokumentation. Meine zweite Wahl wäre wahrscheinlich Xapian, die schnell ist und eine ziemlich gute API hat. Sie sind alle ziemlich reife Produkte. Wenn du nicht weißt, was du wirklich brauchst, würde ich einfach mit Whoosh gehen.

    
zeekay 17.07.2011 15:27
quelle
2
___ qstntxt ___

Ich bin ein Newb-Coder in einem Startup und ich implementiere die Suche von Dokumenten in einem Verzeichnis in einem Web-Host.

Ich vergleiche Lucene / Solr, Whoosh, Sphinx und Xapian. Whoosh ist nativ Python. Aber ich möchte auch Ihre Meinung dazu. Welche davon haben

  • ausgereift und einfach zu bedienen und zu installieren Schnittstellen mit Python? (Whoosh ist ein Kinderspiel)
  • keine Chance für Abstürze, Engpässe und andere Ausfälle
  • am besten dokumentierte Schnittstelle (Ich lese keine PHP-Dokumente, weil Python-Dokumente spärlich waren)
  • am einfachsten aufzustehen (nur einer hat eine Schnellstartanleitung)
___ qstnhdr ___ Unter Lucene / Solr, Whoosh, Sphinx, Xapian, welches sich am besten mit Python verbindet? [geschlossen] ___ tag123python ___ Python ist eine dynamische und stark typisierte Programmiersprache, die die Usability betont. Zwei ähnliche, aber größtenteils inkompatible Versionen von Python sind weit verbreitet (2 und 3). Wenn Sie eine versionsspezifische Python-Frage haben, sollten Sie die Tags [python-2.7] oder [python-3.x] zusätzlich zum Tag [python] verwenden. Wenn Sie eine Python-Variante wie jython, pypy, iron-python usw. verwenden, kennzeichnen Sie diese bitte entsprechend. ___ answer6755581 ___

Wenn Sie eine schnelle Python-Integration wünschen, versuchen Sie indextank . Sie können in 2 Minuten loslegen und es ist kostenlos.

Für die anderen Alternativen würde ich mit Solr gehen (vorausgesetzt, Sie möchten die Suchserver selbst hosten oder sich für websolr anmelden)

Haftungsausschluss: Ich arbeite bei indextank.

    
___ tag123fulltextsearch ___ Bei der Volltextsuche werden Dokumente gesucht, die normalerweise unstrukturierten Text enthalten, im Gegensatz zu Textfeldern in einer strukturierten Datenbank. ___ answer6724817 ___

Verwenden Sie Whoosh, wenn Sie die Geschwindigkeit nicht benötigen, zusätzliche Funktionen der Alternativen. Es ist großartig, hat eine nette API, gute Dokumentation. Meine zweite Wahl wäre wahrscheinlich Xapian, die schnell ist und eine ziemlich gute API hat. Sie sind alle ziemlich reife Produkte. Wenn du nicht weißt, was du wirklich brauchst, würde ich einfach mit Whoosh gehen.

    
___ answer6835593 ___

Apropos Apache Solr, Python hat mehrere Solr-Clients , die ich aufgrund von Feedback von unseren Kunden gesammelt habe Websolr :

  1. Heuhaufen ist sehr beliebt und wurde für die nahtlose Integration in Django-Apps entwickelt. Wenn Sie eine Django-App entwickeln, ist Haystack genau das Richtige für Sie.
  2. Sonnenbrand scheint generischer zu sein als Heuhaufen und ist auch sehr gut dokumentiert. Wenn du schlicht ol 'Python machst, ist Sunburnt einen Blick wert.

Andere Python Solr-Clients, die ich gefunden habe, scheinen etwas niedriger zu sein ...

Einige weitere Details dazu, wie Ihre App aufgebaut ist (insbesondere, ist es eine Django-App?) würden dazu beitragen, die Dinge von hier aus einzugrenzen. Viel Glück bei der Suche nach der besten Lösung für Ihre App!

    
___ tag123sphinx ___ Sphinx ist eine kostenlose Software-Suchmaschine zum Indexieren von Datenbankinhalten. HINWEIS: Verwenden Sie für das Python-Dokumentationstool das [python-sphinx] -Tag. ___ tag123solr ___ Apache Solr ist ein Open-Source-Suchserver, der auf der Lucene-Java-Suchbibliothek basiert. ___ tag123whoosh ___ Whoosh ist eine schnelle, funktionsreiche Volltextindizierungs- und Suchbibliothek, die in reinem Python implementiert ist. ___
dbuthay 20.07.2011 00:56
quelle