Я хочу очистить информацию с html-страницы с помощью Beautiful Soup в Python, и вся информация, которая мне нужна, находится в теге с тем же именем> Как я могу различать каждую информацию, которая мне нужна?
Вся необходимая мне информация находится в тегах разного класса = "hAyfc".
Результат будет в порядке. Вам просто нужно взять результат из-за того, что порядок результатов совпадает с порядком в html
from bs4 import BeautifulSoup
html = """
<div class = "hAyfc">
<div class = "BgcNfc">pro </div>
<span class = "htlgb">
<div>
<span class = "htlgb">
codeA
</span>
</div>
</span>
</div>
<div class = "hAyfc">
<div class = "BgcNfc">pro </div>
<span class = "htlgb">
<div>
<span class = "htlgb">
codeB
</span>
</div>
</span>
</div>
"""
bs = BeautifulSoup(html,"lxml")
result = [e.text for e in bs.find_all("div",{"class":"hAyfc"})]
print(result)