foreach внутри для каждого (preg match url и imgurl)

Question

foreach внутри для каждого (preg match url и imgurl)

0

У меня есть html в переменной ($ data) и найдите URL-адрес, который я называю $url и imgurl,

но я не могу понять, как найти URL-адрес для каждого элемента (он заканчивается повторением всех совпадений не для каждого).

Я пытаюсь изучить решение в целом, скажем, у вас есть html-страница, которую вы хотите извлечь img src и href src, и эхо все из них для каждого...

$data = "75http://upload.wikimedia.org/wikipedia/commons/7/7a/Britney_Spears_2013.jpg\46imgrefurl\75http://en.wikipedia.org/wiki/Britney_Spears\?imgurl\75http://www.spirituelquotes.com/wp-content/uploads/2014/12/britney-spears.jpg\46imgrefurl\75http://www.spirituelquotes.com/celebrities/britney-spears/";


//finds url; (below is code rough to give an idea ) 
 preg_match_all("/ru=\'(.*?)\'\;/is", $data, $matches); 
matches = $url;

 //finds imgurl
 preg_match_all("/imgurl%5C75(.*?)%5C/is", $data, $matches); 

 matches = $img;

 foreach $maches(){
 echo $url $img;  
 //whatever else you want to do
 }


output would be:

http://www.example.com http://www.example.com/image.jpg

http://www.example.com/dir/name2 http://www.example.com/image2.jpg

http://www.example.com/dir/name3 http://www.example.com/image3.jpg

http://www.example.com/dir/name3 http://www.example.com/image4.jpg

или:

$data = getfile contents(http://example.com)  

//finds url;
preg_match_all("/ru=\'(.*?)\'\;/is", $data, $matches); 
matches = $url

//finds the img url
 preg_match_all("/imgurl%5C75(.*?)%5C/is", $data, $matches); 

foreach($matches[1] as $imgurl){
 echo $imgurl $url and (basically want to echo url for each matches in foreach command)


 }

этот код работает, но я просто хочу добавить URL-адрес внутри каждого из них:

preg_match_all("/ru=\'(.*?)\'\;/is", $data, $matches); 
foreach($matches[1] as $url)


preg_match_all("/imgurl%5C75(.*?)%5C/is", $data, $matches); 
foreach($matches[1] as $imgurl){
$filename = basename($imgurl);

    echo $imgurl; //works
    echo $url; //displays all $urls found

$img = "$filename";

error_reporting(E_ALL);

$ch = curl_init(); 
$timeout = 0; 
curl_setopt ($ch, CURLOPT_URL, $imgurl); 
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout); 

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1); 

$image = curl_exec($ch); 
curl_close($ch); 

$f = fopen($img, 'w');
fwrite($f, $image);
fclose($f);


}

}
}

user3754240 11 янв. 2015, в 14:41

Источник

0

Этот php файл работает или выдает какую-то ошибку. Смотрите строку после первых совпадений preg_match
Utkarsh Dixit 11 янв. 2015, в 13:09
0

Ваш псевдокод недостаточно понятен. Поскольку мы не знаем html-код, который вы пытаетесь проанализировать, мы не сможем вам помочь.
Lorenz Meyer 11 янв. 2015, в 13:12
0

Я пытаюсь изучить tecneq в целом, скажем, у вас есть html-страница, которую вы хотите извлечь img src и href src, и вывести их все для каждого ...
user3754240 11 янв. 2015, в 13:25
0

хорошо добавлен HTML-код
user3754240 11 янв. 2015, в 13:57

Показать ещё 2 комментария

Теги:

php

foreach

1 ответ

Ещё вопросы

Этот php файл работает или выдает какую-то ошибку. Смотрите строку после первых совпадений preg_match
Ваш псевдокод недостаточно понятен. Поскольку мы не знаем html-код, который вы пытаетесь проанализировать, мы не сможем вам помочь.
Я пытаюсь изучить tecneq в целом, скажем, у вас есть html-страница, которую вы хотите извлечь img src и href src, и вывести их все для каждого ...

Fleshgrinder · Accepted Answer · 2015-01-11T12-41-00.000Z

Попытка разобрать что-то сложное, как HTML с регулярными выражениями, всегда плохая идея. Вы должны использовать парсер для такой работы.

<?php

// Suppress errors on unknown elements.
libxml_use_internal_errors(true);

// Create a new libxml2 DOM document instance.
$domDocument = new \DOMDocument();

// Parse the HTML string.
$domDocument->loadHTML("<a href=http://www.example.com/dir/name><img src=http://www.example.com/image.jpg></a><a href=http://www.example.com/dir/name2><img src=http://www.example.com/image2.jpg></a><a href=http://www.example.com/dir/name3><img src=http://www.example.com/image3.jpg></a><a href=http://www.example.com/dir/name4><img src=http://www.example.com/image4.jpg></a>");

// Go through all DOM elements we are interested in.
foreach (array("a" => "href", "img" => "src") as $tagName => $attribute) {
    foreach ($domDocument->getElementsByTagName($tagName) as $domElement) {
        // Make sure the element has the desired attribute.
        if ($domElement->hasAttribute($attribute)) {
            echo $domElement->getAttribute($attribute) , PHP_EOL;
        }
    }
}

Обратите внимание, что libxml2 может вызывать ошибки, если вы попытаетесь проанализировать документ HTML5, содержащий некоторые из новых элементов. Вы можете обойти эту проблему, используя libxml_use_internal_errors.

Если вы настаиваете на использовании регулярных выражений или просто хотите изучать регулярные выражения (ознакомьтесь с regx101.com [no affiliation] для изучения регулярных выражений), то решением будет:

<?php

$data = "<a href=http://www.example.com/dir/name><img src=http://www.example.com/image.jpg></a><a href=http://www.example.com/dir/name2><img src=http://www.example.com/image2.jpg></a><a href=http://www.example.com/dir/name3><img src=http://www.example.com/image3.jpg></a><a href=http://www.example.com/dir/name4><img src=http://www.example.com/image4.jpg></a>";

preg_match_all("/(?:href|src)=(?:\"|')?([^\"'> ]*)(?:\"|'| |>)/", $data, $matches);

var_dump($matches);

/* OUTPUT:
array(2) {
  [0]=>
  array(8) {
    [0]=>
    string(37) "href=http://www.example.com/dir/name>"
    [1]=>
    string(37) "src=http://www.example.com/image.jpg>"
    [2]=>
    string(38) "href=http://www.example.com/dir/name2>"
    [3]=>
    string(38) "src=http://www.example.com/image2.jpg>"
    [4]=>
    string(38) "href=http://www.example.com/dir/name3>"
    [5]=>
    string(38) "src=http://www.example.com/image3.jpg>"
    [6]=>
    string(38) "href=http://www.example.com/dir/name4>"
    [7]=>
    string(38) "src=http://www.example.com/image4.jpg>"
  }
  [1]=>
  array(8) {
    [0]=>
    string(31) "http://www.example.com/dir/name"
    [1]=>
    string(32) "http://www.example.com/image.jpg"
    [2]=>
    string(32) "http://www.example.com/dir/name2"
    [3]=>
    string(33) "http://www.example.com/image2.jpg"
    [4]=>
    string(32) "http://www.example.com/dir/name3"
    [5]=>
    string(33) "http://www.example.com/image3.jpg"
    [6]=>
    string(32) "http://www.example.com/dir/name4"
    [7]=>
    string(33) "http://www.example.com/image4.jpg"
  }
}
*/

спасибо, но я попробовал, но он не поддерживает нестандартные теги ... imgurl \ 75http: //upload.wikimedia.org/wikipedia/commons/7/7a/Britney_Spears_2013.jpg \ 46imgrefurl \ 75http: //en.wikipedia .org / wiki / Britney_Spears \ imgurl \ 75http: //img2-3.timeinc.net/people/i/2012/news/121001/britney-spears-2-300.jpg \ 46imgrefurl \ 75http: //www.people .com / люди / статьи / 0,, 20737254,00.html \
Вы прочитали мой полный ответ? Я заявил, что вы можете использовать libxml_use_internal_errors если вам нужно проанализировать нестандартные теги. Я также расширил свой ответ с помощью регулярного выражения для вас.
Я прочитал этот ответ, но мой мозг настолько ограничен в обучении, что только для того, чтобы пройти этот путь, потребовалось 100 процентов умственной силы, которые я хотел изучить внутри .... но я погуглил libxml, и это стало более запутанным, извините ... спасибо вам, земляки, за помощь
Я добавил код, который работает в пределах 1 preg, соответствует всем, но не URL
Вы не сможете понять ни одного решения, если не разберетесь в основах PHP. Попробуйте почитать книгу или сайт по изучению PHP или любого другого языка программирования высокого уровня, это вам очень поможет. Мой ответ содержит два идеальных решения, которые должны работать для вас. Я также добавил использование функции libxml_use_internal_errors для вас.
Ответ содержит единственное регулярное выражение, которое извлекает href и src .
Я согласен с вами, но в моей стране я всегда ограничен временем в интернет-кафе и выходами из сети. скоро я узнаю xml. но у меня СДВГ действительно трудно сосредоточиться на чем-либо
Но вы наверняка можете купить книгу в своей стране. ;) Регулярные выражения, конечно, являются последним средством, если у вас нет возможности использовать парсер, предназначенный для этой работы.
Вы правы, но после этого мне придется полностью посвятить себя уборке желобов. Я забуду все, что узнал о компьютерах. блочный хост-документ :(