Haben Sie bereits Ergebnisse von nutch crawl mit elasticsearch indiziert?

8

Hat jemand Glück gehabt, benutzerdefinierte Indexer für nutch zu schreiben, um die Crawl-Ergebnisse mit elasticsearch zu indexieren? Oder kennen Sie schon existierende?

    
neildf 15.05.2011, 23:58
quelle

4 Antworten

2

Ich habe es noch nicht gemacht, aber das ist definitiv machbar, würde aber den SOLR-Code (src / java / org / apache / nutch / indexer / solr) piggybacken und an ElasticSearch anpassen. Wäre ein schöner Beitrag zu Nutch BTW

    
Julien Nioche 25.05.2011, 15:22
quelle
10

Ich habe ein ElasticSearch-Plugin geschrieben, das die Solr-API verspottet. Mit diesem Plugin und dem Standard-NUTCH-Solr-Indexer können Sie einfach gecrawlte Daten in ElasticSearch senden. Plugin und ein Beispiel, wie man es mit Nutch benutzt, finden Sie auf GitHub:

Ссылка

    
Matt Weber 09.02.2012 20:29
quelle
3

Ich weiß, dass Nutch Pluggable-Backends hinzufügen wird und froh ist, es zu sehen. Ich musste elasticsearch mit Nutch 1.3 integrieren. Der Code ist hier veröffentlicht. Piggybacked vom Code (src / java / org / apache / nutch / indexer / solr).

Ссылка

    
ctjmorgan 21.11.2011 13:52
quelle
0

Die Zeit vergeht und jetzt ist Nucth bereits gut in ElasticSearch integriert. Hier ist ein nettes Tutorial.

    
Duong Nguyen 15.01.2016 09:03
quelle