В настоящее время я очищаю данные со страницы Википедии. Существует таблица, содержащая район, местоположение, стоимость оружия,...., граждане, не являющиеся гражданами Швейцарии.
После прочтения исходной страницы таблица находится во втором номере, а перед ней стоит другая таблица.
После извлечения этой таблицы со страницы с помощью кода:
source = requests.get("https://en.wikipedia.org/wiki/Subdivisions_of_Z%C3%BCrich").text
soup = BeautifulSoup(source,'lxml')
tables = soup.find_all("table")
secondTable = tables[1]
Единственное различие между другим тегом td - это заголовок атрибута, который присутствует в столбце окрестности.
Мне нужно выбрать только теги <td>
, у которых есть атрибут title, но их значения разные, и я не знаю, как это выбрать.
Вы можете использовать селектор, который просто соответствует атрибуту без указания значения:
tables.select("td[title]")
или вы можете использовать True
в качестве значения атрибута с помощью find_all()
для соответствия любому значению:
tables.find_all("td", title=True)