Работа с Apache Nutch 2.2.1

1

Я пытаюсь начать свой первый обход, я уже настроил параметры базы данных, и я выполняю следующую команду: bin/nutch inject urls

И результат ошибки следующий:

InjectorJob: starting at 2014-07-18 08:13:34
InjectorJob: Injecting urlDir: urls
InjectorJob: Using class org.apache.gora.sql.store.SqlStore as the Gora storage class.
InjectorJob: java.lang.RuntimeException: job failed: name=inject urls, jobid=job_local1172062909_0001
        at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
        at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
        at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)

Кто-нибудь может мне помочь?

Теги:
web-crawler
nutch
gora

1 ответ

0

Томас.

Какую версию Горы вы используете? SqlStore был включен только в Gora 0.1, и теперь это недостающая функция, которая будет реализована. Извините за плохие новости :( Я думаю, что модуль sql был удален из-за некоторых проблем с лицензией... Я думаю.

Извините за плохие новости :( в какой-то момент модуль наверняка вернется.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню