Получить текст между двумя дочерними элементами с текстом

Question

Получить текст между двумя дочерними элементами с текстом

1

Мне интересно, есть ли способ легко получить текст, который зажат между двумя дочерними элементами с текстом? В этом конкретном случае я хочу извлечь текст USD.

<div class="indemandProgress-raised ng-binding">
    <span class="indemandProgress-raisedAmount ng-binding" gogo-test="raised">
        $6,811,034
    </span>
    USD
    <span class="ng-binding">
        total funds raised
    </span>
</div>

Фактический формат кода в браузере

<div class="indemandProgress-raised ng-binding">
<span class="indemandProgress-raisedAmount ng-binding" gogo-test="raised">$6,811,034</span> USD <span class="ng-binding">total funds raised</span>
</div>

Возможно ли это с помощью XPATH, или мне нужно извлечь весь текст и затем проанализировать его?

Он должен работать с Селеном.

Anthony 08 июль 2018, в 01:15

Источник

Теги:

python

xpath

selenium

3 ответа

1

Вы уже приняли ответ, но обратите внимание, что text.split()[1] является довольно ненадежным решением и может быть неприменим в других случаях (в большинстве случаев). Например, если первый текстовый узел содержит пробелы

$ 6,811,034

Вы можете попробовать это решение:

element = browser.find_element_by_class_name('indemandProgress-raisedAmount')
result = browser.execute_script('return arguments[0].childNodes[2].textContent;', element).strip()

Обратите внимание, что div имеет следующие 5 дочерних узлов:

Пустая строка (индекс 0)
span узел (индекс 1)
Текстовый узел "USD" (индекс 2)
Другой span (индекс 3)
Другая пустая строка (индекс 4)

Вам нужно получить текстовое содержимое третьего дочернего узла и childNodes[2].textContent позволяет вам делать это

Andersson 08 июль 2018, в 04:12

0

def полезно знать, но из сотен случаев browser.find_element_by_xpath(...).text всегда возвращает результат, похожий на $107,866 USD total funds raised в $107,866 USD total funds raised .
BugWhisperer 08 июль 2018, в 19:55
0

в вашем примере, result = browser.execute_script('return arguments[0].childNodes[2].textContent;', element).strip() , element передается в качестве arguments ?
BugWhisperer 08 июль 2018, в 19:57
0

Ага. arguments[0] == element . Это просто упрощенный синтаксис для browser.execute_script('return document.querySelector(".indemandProgress-raisedAmount").childNodes[2].textContent;').strip()
Andersson 08 июль 2018, в 19:58
0

хорошо, интересно. это очень круто, как вы можете выбрать элемент с селеном, сохранить его как переменную, а затем передать его в JavaScript в качестве переменной
BugWhisperer 08 июль 2018, в 20:00

Показать ещё 2 комментария

0

Вы не можете сделать это с помощью XPath, но вы можете использовать Javascript Executor и получить текстовый узел. Вы не указали язык, поэтому здесь вы можете использовать метод С#:

/// <summary>
/// Returns the text of the specified child text node.
/// </summary>
/// <param name="parentElement">The parent <see cref="IWebElement"/> of the desired text node.</param>
/// <param name="index">The index of the childNode collection relative to parentElement</param>
/// <returns>The text of the specified child text node.</returns>
public string GetChildTextNode(IWebElement parentElement, int index = 0)
{
    string s = (string)((IJavaScriptExecutor)driver).ExecuteScript("return arguments[0].childNodes[arguments[1]].textContent;", parentElement, index);
    return s.Trim();
}

В этом случае вы бы назвали это как

IWebElement e = Driver.FindElement(By.CssSelector("div.indemandProgress-raised"));
string s = GetChildTextNode(e, 2);

JeffC 08 июль 2018, в 02:44

0

Myb. я добавил тег Python
BugWhisperer 08 июль 2018, в 19:58

Ещё вопросы

def полезно знать, но из сотен случаев browser.find_element_by_xpath(...).text всегда возвращает результат, похожий на $107,866 USD total funds raised в $107,866 USD total funds raised .
в вашем примере, result = browser.execute_script('return arguments[0].childNodes[2].textContent;', element).strip() , element передается в качестве arguments ?
Ага. arguments[0] == element . Это просто упрощенный синтаксис для browser.execute_script('return document.querySelector(".indemandProgress-raisedAmount").childNodes[2].textContent;').strip()
хорошо, интересно. это очень круто, как вы можете выбрать элемент с селеном, сохранить его как переменную, а затем передать его в JavaScript в качестве переменной

wp78de · Accepted Answer · 2018-07-07T20-49-00.000Z

Попробуйте использовать xpath 2. 0+:

//div[@class="indemandProgress-raised ng-binding"]/text()

Тестовая демонстрация

В Selenium вы не можете использовать XPath, который возвращает атрибуты или текстовые узлы, поскольку поддерживаются только узлы.

Чтобы получить текст, который вы хотите, вы можете использовать Javascript, чтобы извлечь его из текстового узла. Или выберите узел, а затем используйте .text

result = browser.find_element_by_xpath('//div[contains(@class, "indemandProgress-raisedAmount")]').text.split()[1]

Поэтому, в конечном счете, невозможно использовать XPath/text() в Selenium, и вам нужно полагаться на альтернативные методы, как указано.

уже попробовал. не работает с селеном. Я думаю, я должен был добавить это к вопросу. Myb. если вам интересно: WebDriverException: Message: TypeError: Expected an element or WindowProxy, got: [object Text] {}
Вы можете выбрать текстовые узлы с помощью .text ... в любом случае, JS бесполезен, поскольку я могу просто использовать x = browser.find_element_by_xpath(...).text.split()[1] .
«невозможно использовать XPath / text () в Selenium»
так что это совершенно невозможно с xpath в среде селена?
По моим (ограниченным) знаниям, к сожалению, это так. Вот ответ, который утверждает то же самое .