Соскоб информацию с Beautiful Soup в одноименных тегах

Question

Соскоб информацию с Beautiful Soup в одноименных тегах

1

Я хочу очистить информацию с html-страницы с помощью Beautiful Soup в Python, и вся информация, которая мне нужна, находится в теге с тем же именем> Как я могу различать каждую информацию, которая мне нужна?

Вся необходимая мне информация находится в тегах разного класса = "hAyfc".

userHG 15 окт. 2018, в 21:11

Источник

0

Добро пожаловать в StackOverflow! Пожалуйста, прочитайте файл справки. StackOverflow - это обычай для тех, кто задает вопросы, чтобы опубликовать код, показывающий предпринятую ими попытку решить проблемы для себя. Не могли бы вы опубликовать код, который вы написали для этой проблемы, и задать вопрос, касающийся этого кода.
Bill Bell 15 окт. 2018, в 20:53

Теги:

python

beautifulsoup

1 ответ

Ещё вопросы

Добро пожаловать в StackOverflow! Пожалуйста, прочитайте файл справки. StackOverflow - это обычай для тех, кто задает вопросы, чтобы опубликовать код, показывающий предпринятую ими попытку решить проблемы для себя. Не могли бы вы опубликовать код, который вы написали для этой проблемы, и задать вопрос, касающийся этого кода.

kcorlidy · Accepted Answer · 2018-10-16T05-44-00.000Z

Результат будет в порядке. Вам просто нужно взять результат из-за того, что порядок результатов совпадает с порядком в html

from bs4 import BeautifulSoup

html = """
<div class = "hAyfc">
    <div class = "BgcNfc">pro </div>
    <span class = "htlgb">
        <div>
            <span class = "htlgb">
                codeA
            </span>
        </div>
    </span>
</div>

<div class = "hAyfc">
    <div class = "BgcNfc">pro </div>
    <span class = "htlgb">
        <div>
            <span class = "htlgb">
                codeB
            </span>
        </div>
    </span>
</div>
"""

bs = BeautifulSoup(html,"lxml")
result = [e.text for e in bs.find_all("div",{"class":"hAyfc"})]
print(result)