Найти все ссылки внутри таблицы

1

На моей странице html есть:

...
<table class="t1" ..>
<tr><td> ... <a href="">...</a> ... <a href="">..</a>
</table>

...

У меня есть:

html = BeautifulSoup(page)

links = html.findAll('a', ?????????)

Как найти все ссылки внутри этой таблицы?

  • 0
    Вы смотрели в Python HTML парсеры?
  • 1
    @ Ник - Это будет то, что есть BeautifulSoup ...
Теги:
beautifulsoup

3 ответа

4
Лучший ответ

В этом случае найдите таблицу (по классу), затем найдите все ссылки внутри нее.

html = BeautifulSoup(page)
table = html.find('table', 't1')
links = table.findAll('a')
  • 0
    спасибо, теперь какие свойства есть у ссылок?
  • 1
    links будут списком объектов Tag : crummy.com/software/BeautifulSoup/…
1

Более эффективный, чем исходная находка, используйте SoupStrainer:

html  = BeautifulSoup(page, parseOnlyThese=SoupStrainer('table', 't1' ) )
links = html.findAll('a')

См. также Поиск по документации по классу.

0

Это должно вернуть список ссылок на странице

html = BeautifulSoup(page)
links = html.findAll('a')
  • 0
    я не хочу, чтобы все ссылки на странице, только ссылки внутри таблицы с class = t1

Ещё вопросы

Сообщество Overcoder
Наверх
Меню