Проблемы с парсингом Beautiful Soup XML в Python

1

У меня есть этот xml файл, который я хочу проанализировать. Это код, который я написал. Однако кажется, что он не может проанализировать файл, так как он не выводит его.

from bs4 import BeautifulSoup
f=open("1.txt",'r')
y=BeautifulSoup(f, "lxml-xml")
print(y.url)

Выход

None
Теги:
xml-parsing
beautifulsoup

2 ответа

0
Лучший ответ

Первая проблема возникает из-за того, как вы пытаетесь открыть файл, поэтому попробуйте заменить f=open("1.txt",'r') на f=open("1.txt",'r').read().

также я бы рекомендовал вам изменить print(y.url) для print(y.find_all('url')). надеюсь это поможет

1

Использование xml.etree.ElementTree для анализа данных XML

Пример файла XML

<root_element>
    <url>This is my URL</url>
    <url>This is my 2nd URL</url>
</root_element>

Код Python

import xml.etree.ElementTree as ET
path = r"Full_Path of your xml file"
tree = ET.parse(path)
root = tree.getroot()
url=root.findall('url')
url[0].text
url[1].text

Выход

'Это мой URL' 'Это мой второй URL'

Ещё вопросы

Сообщество Overcoder
Наверх
Меню