На моей странице html есть:
...
<table class="t1" ..>
<tr><td> ... <a href="">...</a> ... <a href="">..</a>
</table>
...
У меня есть:
html = BeautifulSoup(page)
links = html.findAll('a', ?????????)
Как найти все ссылки внутри этой таблицы?
В этом случае найдите таблицу (по классу), затем найдите все ссылки внутри нее.
html = BeautifulSoup(page)
table = html.find('table', 't1')
links = table.findAll('a')
links
будут списком объектов Tag
: crummy.com/software/BeautifulSoup/…
Более эффективный, чем исходная находка, используйте SoupStrainer
:
html = BeautifulSoup(page, parseOnlyThese=SoupStrainer('table', 't1' ) )
links = html.findAll('a')
См. также Поиск по документации по классу.
Это должно вернуть список ссылок на странице
html = BeautifulSoup(page)
links = html.findAll('a')