Я использую python lxml.html. У меня есть выражение xpath, которое захватывает текст узла, но мне нужен весь текст, включая теги дочерних тегов и их содержимого. Как мне это достичь?
Метод text_content Element
возвращает текст элемента, включая текстовое содержимое его дочерних элементов без разметки.
Я не уверен, какие теги вы используете; поэтому, я составляю sth.
Вы можете попробовать:
result = lxml.html.parse(url).xpath("//tr/td/a/text()")
//tr означает Выбирает узлы в документе из текущего узла, которые соответствуют выбору, независимо от того, где они находятся.
Вы можете использовать это выражение ('//'), чтобы захватить теги дочерних тегов.