Мне нужна ваша помощь. Я разбираю статью в википедии и использую Wikimedia api. Я хочу прочитать текст между {{ }}
. Вот мой запрос wikimedia api. Я пытался, но не нашел удачи. Кто-нибудь может мне помочь, пожалуйста? Спасибо большое.
def getCategory(title):
paramsd = {'action': 'query', 'prop': 'revisions', 'rvprop': 'content', 'format': 'xmlfm', 'rvsection': 0,'titles':title}
params = urllib.urlencode(paramsd)
req = urllib2.Request(url='http://en.wikipedia.org/w/api.php', data=params)
f = urllib2.urlopen(req)
Вы знаете, есть несколько библиотек, уже написанных для этой цели, в python есть pywikipedia, и есть больше для каждого языка когда-либо. Там есть список на http://www.mediawiki.org/wiki/API:Client_code#API_Access_Libraries, в котором перечислены четыре библиотеки для python. Я бы использовал один из них вместо того, чтобы кататься самостоятельно.
У вас есть ошибка в коде.
'format': 'xmlfm'
Должен прочесть
'format': 'xml'
Таким образом, вы получите XML.