Соответствует ограниченному количеству пробелов, игнорируя те, которые являются частью тега

Question

Соответствует ограниченному количеству пробелов, игнорируя те, которые являются частью тега

1

Я пытаюсь создать регулярное выражение, которое соответствует пяти последним "словам" ввода, где "слово" определяется как все, что соответствует [^ ]+ или [^ ]*<[^>]*>[^ ]* (так что все, разделенные пробелами, но считая пробелы между < и > как буквы)

Я попробовал это:

/([^ ]+(?:(?<!<[^>]+) +(?![^<]*>)(?:.*?)){0,4})$/

но это дает мне ошибку, что lookbehind должна быть фиксированной длины.

Скажем, у меня есть следующая строка:

'It\ just that he <span class="verb">appear</span>ed rather late.'

он должен соответствовать

'that he <span class="verb">appear</span>ed rather late.'

joelproko 28 май 2015, в 16:02

Источник

0

Пожалуйста, добавьте одну или несколько примеров строк и ожидаемый результат.
Casimir et Hippolyte 28 май 2015, в 13:43
0

Один из способов был бы в while (preg_match('/<[^> ]* /',$input)) $input = preg_replace('/(<[^> ]*) /','$1'."\0",$input); preg_match('/(?:(?:[^ ]+) ){0,4}[^ ]*$/',$input,$match); $input = str_replace("\0"," "); $match[0] = str_replace("\0"," "); но это кажется довольно грубым и может привести к поломке, если используемый символ (\ 0 здесь) уже появляется на входе
joelproko 28 май 2015, в 13:53
1

в случае, если вы не знали - посмотрите на верхний ответ здесь: stackoverflow.com/questions/1732348/… :-)
Geo 28 май 2015, в 14:08
0

Нужно ли здесь регулярное выражение по какой-то причине? Это гораздо проще , не первое использование strip_tags() функцию , а затем conut «слова» или даже explode() строки?
D. Cichowski 28 май 2015, в 14:12
0

Достойная идея, SilentDariusz, но теги должны остаться.
joelproko 29 май 2015, в 09:11

Показать ещё 3 комментария

Теги:

php

xml

regex

pcre

2 ответа

Ещё вопросы

Пожалуйста, добавьте одну или несколько примеров строк и ожидаемый результат.
Один из способов был бы в while (preg_match('/<[^> ]* /',$input)) $input = preg_replace('/(<[^> ]*) /','$1'."\0",$input); preg_match('/(?:(?:[^ ]+) ){0,4}[^ ]*$/',$input,$match); $input = str_replace("\0"," "); $match[0] = str_replace("\0"," "); но это кажется довольно грубым и может привести к поломке, если используемый символ (\ 0 здесь) уже появляется на входе
в случае, если вы не знали - посмотрите на верхний ответ здесь: stackoverflow.com/questions/1732348/… :-)
Нужно ли здесь регулярное выражение по какой-то причине? Это гораздо проще , не первое использование strip_tags() функцию , а затем conut «слова» или даже explode() строки?
Достойная идея, SilentDariusz, но теги должны остаться.

Geo · Answer 1 · 2015-05-28T12-06-00.000Z

Я думаю, что ваше решение уже было довольно близко. См. Следующий:

$str = 'It\ just that he <span class="verb">appear</span>ed rather late.';
$reg = '/(([^ ]*<[^>]*>[^ ]*)+|[^ ]+)/'; // let me know if you need explanation
if (preg_match_all($reg, $str, $m)) { // "_all" to match more than one
    $m = array_slice($m[0], -5, 5, true); // last 5 words
    //$m = implode(' ', $m); // uncomment this if you want a string instead of array
    print_r($m);
}

Возвращает:

Array
(
    [2] => that
    [3] => he
    [4] => <span class="verb">appear</span>ed
    [5] => rather
    [6] => late.
)

Приятно. Работает для моего конкретного случая. Вероятно, не будет работать, если бы были вложенные теги (скажем, если было что-то вроде <em><span class="verb">appear</span>ed</em> ), но, к счастью, это не так для меня.
Правильно. На самом деле может быть больше вопросов. Помните: stackoverflow.com/questions/1732348/…

Casimir et Hippolyte · Answer 2 · 2015-05-28T12-48-00.000Z

Простой способ:

preg_match('~^(?:\s*[^>\s]*(?:>[^<]*<[^>\s]*)*){0,5}~', strrev(rtrim($str)), $m);
$result = strrev($m[0]);

это возвращает span class="verb">appeared rather late.