разбор Викимедиа API

1

Мне нужна ваша помощь. Я разбираю статью в википедии и использую Wikimedia api. Я хочу прочитать текст между {{ }}. Вот мой запрос wikimedia api. Я пытался, но не нашел удачи. Кто-нибудь может мне помочь, пожалуйста? Спасибо большое.

def getCategory(title):
paramsd = {'action': 'query', 'prop': 'revisions', 'rvprop': 'content', 'format': 'xmlfm', 'rvsection': 0,'titles':title}
params = urllib.urlencode(paramsd)
req = urllib2.Request(url='http://en.wikipedia.org/w/api.php', data=params)
f = urllib2.urlopen(req)
  • 1
    «Вы смотрите на HTML-представление формата XML. HTML хорош для отладки, но, вероятно, не подходит для вашего приложения ». - должен дать вам подсказку.
Теги:
mediawiki

2 ответа

3
Лучший ответ

Вы знаете, есть несколько библиотек, уже написанных для этой цели, в python есть pywikipedia, и есть больше для каждого языка когда-либо. Там есть список на http://www.mediawiki.org/wiki/API:Client_code#API_Access_Libraries, в котором перечислены четыре библиотеки для python. Я бы использовал один из них вместо того, чтобы кататься самостоятельно.

0

У вас есть ошибка в коде.

'format': 'xmlfm'

Должен прочесть

'format': 'xml'

Таким образом, вы получите XML.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню