Ich versuche, nutch 1.11 zu kriegen. Ich benutze Cygwin, um diese Befehle in Windows 8 auszuführen.
Ich habe hadoop-core jar in den lib-Ordner gestellt, aber wenn ich versuche, einen Crawl auszuführen, erhalte ich:
Ausnahme im Thread "main" java.lang.NoSuchMethodError: org.apache.commons.cli.OptionBuilder.withArgPattern (Ljava / lang / Zeichenfolge; I) Lorg / apache / commons / cli / OptionBuilder; bei org.apache.hadoop.util.GenericOptionsParser.buildGeneralOptions (GenericOptionsParser.java:207) bei org.apache.hadoop.util.GenericOptionsParser.parseGeneralOptions (GenericOptionsParser.java:370) bei org.apache.hadoop.util.GenericOptionsParser. (GenericOptionsParser.java:153) bei org.apache.hadoop.util.GenericOptionsParser. (GenericOptionsParser.java:138) bei org.apache.hadoop.util.ToolRunner.run (ToolRunner.java:59) bei org.apache.nutch.crawl.Injector.main (Injector.java:369)
Der Befehl ist
$ bin / nutch inject crawl / crawldb URLs
Tags und Links windows web-crawler nutch