Ich habe es noch nicht gemacht, aber das ist definitiv machbar, würde aber den SOLR-Code (src / java / org / apache / nutch / indexer / solr) piggybacken und an ElasticSearch anpassen. Wäre ein schöner Beitrag zu Nutch BTW
Ich habe ein ElasticSearch-Plugin geschrieben, das die Solr-API verspottet. Mit diesem Plugin und dem Standard-NUTCH-Solr-Indexer können Sie einfach gecrawlte Daten in ElasticSearch senden. Plugin und ein Beispiel, wie man es mit Nutch benutzt, finden Sie auf GitHub:
Die Zeit vergeht und jetzt ist Nucth bereits gut in ElasticSearch integriert. Hier ist ein nettes Tutorial.
Tags und Links full-text-search web-crawler elasticsearch lucene nutch