Nutch in Windows: Fehler beim Festlegen der Berechtigungen für den Pfad

8

Ich versuche, Solr mit Nutch auf einer Windows-Maschine zu verwenden, und ich bekomme den folgenden Fehler:

%Vor%

Aus vielen Threads habe ich gelernt, dass hadoop, das von nutch benutzt wird, eine chmod-Magie benutzt, die auf Unix-Maschinen funktioniert, aber nicht auf Windows.

Dieses Problem besteht nun seit mehr als einem Jahr. Ich habe einen Thread gefunden, in dem die Codezeile angezeigt und ein Fix vorgeschlagen wird. Bin ich wirklich der Einzige, der dieses Problem hat? Erstellen alle anderen Benutzer einen benutzerdefinierten Build, um auf Windows zu arbeiten? Oder gibt es eine Option, um das Hadoop-Zeug oder eine andere Lösung zu deaktivieren? Vielleicht ein anderer Crawler als Nutch?

Vielen Dank. Boris

Hier ist der Stack-Trace von dem, was ich tue ....

%Vor%     
Boris Crismancich 03.03.2013, 16:53
quelle

5 Antworten

4

Es hat eine Weile gedauert, bis das funktionierte, aber hier ist die Lösung, die auf nutch 1.7 funktioniert.

  1. Laden Sie Hadoop Core 0.20.2 aus dem MVN-Repository
  2. Ersetzen Sie (nutch-directory) /lib/hadoop-core-1.2.0.jar durch die heruntergeladene Datei mit demselben Namen.

Das sollte es sein.

Erläuterung

Dieses Problem wird von hadoop verursacht, da davon ausgegangen wird, dass Sie unter Unix laufen und sich an die Regeln für die Dateiberechtigungen halten. Das Problem wurde 2011 behoben, aber nutch hat die von ihnen verwendete hadoop-Version nicht aktualisiert. Die entsprechenden Korrekturen sind hier und hier

    
Diaa 07.02.2014, 20:49
quelle
2

Wir benutzen auch Nutch, aber es wird nicht unter Windows unterstützt, auf Cygwin hatte unsere Version 1.4 ähnliche Probleme wie du, sowas wie mapreduce.

Wir haben es gelöst, indem wir ein vm (Virtual box) mit Ubuntu und ein gemeinsames Verzeichnis zwischen Windows und Linux verwendet haben, damit wir unter Windows entwickeln und bauen und Nutch (crawlen) unter Linux ausführen können.

    
jpee 05.03.2013 20:50
quelle
1

Ich habe Nutch auf Windows laufen, kein Custom Build. Es ist lange her, dass ich es noch nicht benutzt habe. Aber eine Sache, die mich eine Weile brauchte, um zu fangen, ist, dass Sie cygwin als Windows-Administrator ausführen müssen, um die notwendigen Rechte zu bekommen.

    
Mille Bii 04.03.2013 08:59
quelle
0

Ich schlage einen anderen Ansatz vor. Überprüfen Sie diesen Link . Es erklärt, wie man den Fehler unter Windows schluckt, und erfordert nicht, dass Sie Hadoop herunterstufen oder Nutch neu aufbauen. Ich habe auf Nutch 2.1 getestet, aber es gilt auch für andere Versionen. Ich habe auch eine einfache .bat zum Starten des Crawlers und Indexers erstellt , aber es ist für Nutch 2.x gedacht, möglicherweise nicht anwendbar für Nutch 1.x.

    
kaqqao 18.02.2014 15:19
quelle
0

Sie müssen die Projektabhängigkeiten Hadoop-Core und Hadoop-Tools ändern. Ich benutze 0,20.2 Version und funktioniert gut.

    
vetus 03.03.2014 13:49
quelle

Tags und Links