Соскоб информацию с Beautiful Soup в одноименных тегах

1

Я хочу очистить информацию с html-страницы с помощью Beautiful Soup в Python, и вся информация, которая мне нужна, находится в теге с тем же именем> Как я могу различать каждую информацию, которая мне нужна?

Изображение 174551 Вся необходимая мне информация находится в тегах разного класса = "hAyfc".

  • 0
    Добро пожаловать в StackOverflow! Пожалуйста, прочитайте файл справки. StackOverflow - это обычай для тех, кто задает вопросы, чтобы опубликовать код, показывающий предпринятую ими попытку решить проблемы для себя. Не могли бы вы опубликовать код, который вы написали для этой проблемы, и задать вопрос, касающийся этого кода.
Теги:
beautifulsoup

1 ответ

1
Лучший ответ

Результат будет в порядке. Вам просто нужно взять результат из-за того, что порядок результатов совпадает с порядком в html

from bs4 import BeautifulSoup

html = """
<div class = "hAyfc">
    <div class = "BgcNfc">pro </div>
    <span class = "htlgb">
        <div>
            <span class = "htlgb">
                codeA
            </span>
        </div>
    </span>
</div>

<div class = "hAyfc">
    <div class = "BgcNfc">pro </div>
    <span class = "htlgb">
        <div>
            <span class = "htlgb">
                codeB
            </span>
        </div>
    </span>
</div>
"""

bs = BeautifulSoup(html,"lxml")
result = [e.text for e in bs.find_all("div",{"class":"hAyfc"})]
print(result)

Ещё вопросы

Сообщество Overcoder
Наверх
Меню