Как извлечь подстроку из строки, которая динамически изменяется по отношению к нескольким разделителям с помощью Selenium в Python

1

Интересно, можно ли удалить часть скребковой строки, например:

Wujek Drew / Uncle Drew

в

Uncle Drew

Конечно, поскольку это веб-соскабливание, названия будут разными каждый раз, так что я могу сделать здесь, чтобы получить результат выше?


Обновить

Я забыл добавить что-то, что нужно удалить. Wujek Drew/Дядя Дрю (2018) Мне нужно будет удалить данные в конце строки.

  • 0
    Вы всегда хотите игнорировать все, вплоть до косой черты? Или это тоже может измениться?
  • 0
    Косая черта может использоваться для удаления первой части предложения, если это возможно.
Теги:
web-scraping
selenium
selenium-webdriver
split

1 ответ

1
Лучший ответ

Чтобы удалить первую часть скреблированной строки, разделенной символом /, вы можете использовать следующее решение:

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1] 

Согласно обновлению вашего комментария, если вы хотите извлечь подстроку дядю Дрю из строки Wujek Drew/Uncle Drew (2018), вы можете использовать следующее решение:

import re

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])
  • 0
    Спасибо. Я забыл добавить что-то, что также необходимо удалить. Вуек Дрю / Дядя Дрю (2018) Мне нужно будет удалить данные в конце строки. Пытался поиграть с вашим решением, но изо всех сил.
  • 0
    @serengeti Оформите мой ответ обновлением и дайте мне знать статус
Показать ещё 6 комментариев

Ещё вопросы

Сообщество Overcoder
Наверх
Меню