Я хотел бы получить все данные внутри div под тегами br. однако это только выборка текста на первом.
<div itemprop="description">
<p>Chars :
</br>- test1
</br>- test2
</br>- test3
</p>
</div>
сценарий:
tag = soup.find(itemprop="description").get_text()
выход:
Chars
-test1
Я хочу получить весь текст внутри б
У меня не было проблем с lxml и выберите
from bs4 import BeautifulSoup as bs
html = '''
<div itemprop="description">
<p>Chars :
</br>- test1
</br>- test2
</br>- test3
</p>
</div>
'''
soup = bs(html, 'lxml')
data = [item.text.strip().replace('\n',' ') for item in soup.select('div[itemprop=description]')]
print(data)
br
. Возможны следующие варианты: 1) удалить теги br, такие какstr(soup).replace("</br>", "")
или использовать другой синтаксический анализатор:soup = BeautifulSoup(page, 'lxml')
(второй вариант хорошо сработал для меня)