Как получить URL-адреса только из строки с тегами HTML

Question

Как получить URL-адреса только из строки с тегами HTML

0

У меня есть этот код здесь, который обнаруживает URL-адреса внутри строки, содержащей содержимое HTML

$regex = "/(http|https)\:\/\/[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,3}(\/\S*)?/";
                preg_match_all($regex, $desc, $url);
                print_r($url);

Код отлично работает, однако print_r($url) возвращает URL-адреса, такие как:

http://url.com/</p>

</p> просто закрывает <p>, но я не хочу его в своем URL-адресе.

Как я могу это исключить?

Спасибо, Питер

Peter Stuart 21 окт. 2013, в 00:21

Источник

0

Сначала проанализируйте ваш HTML, а затем запустите средство поиска ссылок на текст?
Ry-♦ 20 окт. 2013, в 21:57
0

Как бы я проанализировал HTML?
Peter Stuart 20 окт. 2013, в 22:01
0

stackoverflow.com/questions/3577641/...
Ry-♦ 20 окт. 2013, в 22:02
0

Я собираюсь использовать функцию strip_tags вместо этого, я думаю. Я попробую это
Peter Stuart 20 окт. 2013, в 22:03

Показать ещё 2 комментария

Теги:

php

html

regex

preg-match

preg-match-all

1 ответ

Ещё вопросы

Сначала проанализируйте ваш HTML, а затем запустите средство поиска ссылок на текст?
Я собираюсь использовать функцию strip_tags вместо этого, я думаю. Я попробую это

Peter Stuart · Accepted Answer · 2013-10-20T20-01-00.000Z

Я использовал функцию strip_tags чтобы удалить все теги HTML, а затем preg_match_all() чтобы получить каждый URL-адрес:

$regex = "/(http|https)\:\/\/[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,3}(\/\S*)?/";
preg_match_all($regex, strip_tags(html_entity_decode($desc)), $url);
print_r($url);

Надеюсь, это поможет другим в будущем!

Питер