Используйте scrapy, чтобы сканировать собственность в блоке

0

Я использую scrapy для сканирования этой ссылки:

<input class="xxxmail" type="text" readonly="readonly" value="xxx.org">

Мне просто нужен "xxx.org". Как его получить?

Теги:
web-scraping
scrapy
web-crawler

1 ответ

1

Вы можете использовать следующее выражение xpath:

//input[@class="xxxmail"]/@value

Это позволит получить value атрибута с input тега с "xxxmail" class.

В паук вы должны сначала создать экземпляр Selector а затем extract() из xpath:

sel = Selector(response)
print sel.xpath('//input[@class="xxxmail"]/@value').extract()
  • 0
    Спасибо за ваш ответ. Я попробовал ваш метод. Не работает Я думаю, что проблема не в xpath, но есть div верхнего уровня, показанный как style = "display: block;"
  • 0
    @willie не может сказать больше, не увидев реальную веб-страницу, которую вы сканируете.
Показать ещё 9 комментариев

Ещё вопросы

Сообщество Overcoder
Наверх
Меню