в lxml.html как я могу получить текст, дочерние элементы и содержимое дочерних узлов?

1

Я использую python lxml.html. У меня есть выражение xpath, которое захватывает текст узла, но мне нужен весь текст, включая теги дочерних тегов и их содержимого. Как мне это достичь?

  • 0
    Не могли бы вы объяснить, нужен ли вам «весь текст внутри элемента» или, скорее, «исходный код элемента»? (или что-то другое?)
Теги:
lxml

2 ответа

1

Метод text_content Element возвращает текст элемента, включая текстовое содержимое его дочерних элементов без разметки.

0

Я не уверен, какие теги вы используете; поэтому, я составляю sth.

Вы можете попробовать:

result = lxml.html.parse(url).xpath("//tr/td/a/text()")

//tr означает Выбирает узлы в документе из текущего узла, которые соответствуют выбору, независимо от того, где они находятся.

Вы можете использовать это выражение ('//'), чтобы захватить теги дочерних тегов.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню