Я использую xpath для разбора html без проблем, пока не найду код ниже.
Обычно я использую свойство textContent, которое получил этот td
с помощью запроса x xpath, НО мне нужно получить только текст перед тегом <img
.
<td class="rowdispari">
ZONA NON SERVITA QUOTIDIANAMENTE-PROSSIMA CONSEGNA
<img onmouseover="caricaTool()" src="template/img/infoTip.png" width="17">
<div class="bottom" id='tooool'>
<div class="contenuto">
<div class="top">
<font class="testobold"><font class='testoblubold'>ZONA NON SERVITA QUOTIDIANAMENTE - PROSSIMA CONSEGNA </font><br>La località di destinazione non è tra quelle servite quotidianamente da SDA. La consegna avverrà al più presto possibile, compatibilmente con le operazioni logistiche.</font>
<p> <br><a href="javascript:chiudiTool()"><u>Chiudi</u></a>
</div>
</div>
</div>
</td>
Предполагая, что у вас уже есть XPath для получения внешнего элемента <td>
, вы можете просто добавить XPath с /text()[1]
чтобы получить первый текстовый узел, который является прямым потомком текущего элемента <td>
:
path_to_td_here/text()[1]
более конкретный пример:
//td[@class='rowdispari']/text()[1]
Вы, вероятно, можете использовать:
//td[@class="rowdispari"][img[@src="template/img/infoTip.png"]]/text()[1]
или:
//td[@class="rowdispari"]/text()[following-sibling::img[@src="template/img/infoTip.png"]][1]