Проблемы с парсингом Beautiful Soup XML в Python

Question

Проблемы с парсингом Beautiful Soup XML в Python

1

У меня есть этот xml файл, который я хочу проанализировать. Это код, который я написал. Однако кажется, что он не может проанализировать файл, так как он не выводит его.

from bs4 import BeautifulSoup
f=open("1.txt",'r')
y=BeautifulSoup(f, "lxml-xml")
print(y.url)

Выход

None

Suheldeep Sarkar 18 июнь 2018, в 09:25

Источник

Теги:

python

xml-parsing

beautifulsoup

2 ответа

1

Использование xml.etree.ElementTree для анализа данных XML

Пример файла XML

<root_element>
    <url>This is my URL</url>
    <url>This is my 2nd URL</url>
</root_element>

Код Python

import xml.etree.ElementTree as ET
path = r"Full_Path of your xml file"
tree = ET.parse(path)
root = tree.getroot()
url=root.findall('url')
url[0].text
url[1].text

Выход

'Это мой URL' 'Это мой второй URL'

Surya Tej 18 июнь 2018, в 05:19

Ещё вопросы

Fozoro · Accepted Answer · 2018-06-18T05-14-00.000Z

Первая проблема возникает из-за того, как вы пытаетесь открыть файл, поэтому попробуйте заменить f=open("1.txt",'r') на f=open("1.txt",'r').read().

также я бы рекомендовал вам изменить print(y.url) для print(y.find_all('url')). надеюсь это поможет