получить имя сайта из URL в Python

1

Я новичок в Python, и, похоже, у меня много приятных функций, о которых я не знаю. Какую функцию я могу использовать для получения имени корневого сайта? Например, как я могу получить faqs.org, если бы я дал функции URL-адрес " http://www.faqs.org/docs/diveintopython/kgp_commandline. HTML"?

  • 0
    docs.python.org/library/urlparse.html
  • 0
    Просто чтобы уточнить, вы действительно хотите просто "faqs.org" или "www.faqs.org"? Попытка получить первое - плохая идея, поскольку она не переносима на такие домены, как "www.amazon.co.uk".
Теги:

3 ответа

5
Лучший ответ
 >>> from urllib.parse import urlparse
 >>> urlparse('http://www.cwi.nl:80/%7Eguido/Python.html').hostname
 'www.cwi.nl'
2

В многопроцессе urlparse модуль:

from urlparse import urlparse
scheme, netloc, path, params, query, fragment = urlparse("http://www.faqs.org/docs/diveintopython/kgp_commandline.html")
print netloc
  • 0
    Netloc может включать номер порта
2

С какой версией Python вы учитесь? Обратите внимание, что ответ SilentGhost для Python 3.0, в то время как Alabaster Codify будет работать с серией 2.x.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню