Я использую scrapy для сканирования этой ссылки:
<input class="xxxmail" type="text" readonly="readonly" value="xxx.org">
Мне просто нужен "xxx.org". Как его получить?
Вы можете использовать следующее выражение xpath
:
//input[@class="xxxmail"]/@value
Это позволит получить value
атрибута с input
тега с "xxxmail" class
.
В паук вы должны сначала создать экземпляр Selector
а затем extract()
из xpath
:
sel = Selector(response)
print sel.xpath('//input[@class="xxxmail"]/@value').extract()