Не удается удалить лишние пробелы в строке, полученной из Интернета в php

Question

Не удается удалить лишние пробелы в строке, полученной из Интернета в php

0

Я пытаюсь удалить лишние пробелы строки, которую я получаю из Интернета, используя file_get_contents(). Я попробовал str_replace() иpreg_replace(), а также поиск, но ни один из них не работал.

Вот мой код:

<?php $html_content = file_get_contents("http://mindcity.sina.com.hk/MC-lunar/daily/2014/12/20141209_b5.html");

$html_content =  mb_convert_encoding($html_content, 'UTF-8', 'BIG-5');
$html_content = strip_tags($html_content); 

$start_pos = strrpos($html_content, "宜 :");
$end_pos = strrpos($html_content, "凶神宜忌 :") - strlen($html_content);
$good_to_do = substr($html_content, $start_pos, $end_pos);
echo $good_to_do .'<br>';
//remove whitespace of $good_to_do
$good_to_do = str_replace(' : ','*',$good_to_do);
$good_to_do = preg_replace('/^[\pZ\pC]+|[\pZ\pC]+$/u', '', $good_to_do);
$good_to_do = str_replace(array("\r\n", "\r", "\n", "\t", "\0", "\s", "\x0B", "\x20", "\xA0"), '*', $good_to_do);
var_dump( $good_to_do ); ?>

h3lL0W0RLd 10 дек. 2014, в 08:10

Источник

0

$good_to_do - str_replace что минус - должен быть знаком равенства =
Hanky Panky 10 дек. 2014, в 07:16
0

о, опечатка. Но сделать знак равенства все равно не удалит все пробелы
h3lL0W0RLd 10 дек. 2014, в 07:21

Теги:

php

str-replace

preg-replace

file-get-contents

2 ответа

0

Делать

$good_to_do = preg_replace('/\s+/', '*', $good_to_do);

Я помещаю '*', потому что это то, что вы хотите заменить? Вы можете поместить там что угодно.

Antony D'Andrea 10 дек. 2014, в 05:32

0

В этом случае не удаляются все пробелы
h3lL0W0RLd 10 дек. 2014, в 08:16
0

Попробуйте это foreach(preg_split('//',$var) as $char){ var_dump(ord($char)); } где $ var равно $ good_to_do после ТОЛЬКО применения приведенного выше регулярного выражения и последующего размещения вывода.
Antony D'Andrea 10 дек. 2014, в 08:27
0

Я заметил, что есть китайские чартеры. Пробелы, вероятно, не пробелы, а символы, которые невозможно воспроизвести. \ S соответствует довольно многим пробельным символам.
Antony D'Andrea 10 дек. 2014, в 08:30
0

Попробуйте сделать теги mb_convert_encoding и strip, ПОСЛЕ удаления пространства.
Antony D'Andrea 10 дек. 2014, в 08:32
0

Я применил регулярное выражение перед выполнением mb_convert_encoding() но между строкой осталось несколько пробелов
h3lL0W0RLd 10 дек. 2014, в 09:21
0

Вы делали мой код foreach выше? Это даст код символа каждого символа, который позволит нам идентифицировать пробелы.
Antony D'Andrea 10 дек. 2014, в 09:28
0

это дает мне выходной, как это: int (0) int (229) int (174) int (156) int (58) int (231) int (144) int (134) int (233) int (171) int (174) ) int (38) int (110) int (98) int (115) int (112) ...... Так как же определить пространство?
h3lL0W0RLd 10 дек. 2014, в 09:36
0

Как я и подозревал. Ни один из тех не пробелы. Pre_replace действительно работает. Есть некоторые символы, которые браузер не может отобразить.
Antony D'Andrea 10 дек. 2014, в 09:40

Показать ещё 6 комментариев

Ещё вопросы

$good_to_do - str_replace что минус - должен быть знаком равенства =
о, опечатка. Но сделать знак равенства все равно не удалит все пробелы
В этом случае не удаляются все пробелы
Попробуйте это foreach(preg_split('//',$var) as $char){ var_dump(ord($char)); } где $ var равно $ good_to_do после ТОЛЬКО применения приведенного выше регулярного выражения и последующего размещения вывода.
Я заметил, что есть китайские чартеры. Пробелы, вероятно, не пробелы, а символы, которые невозможно воспроизвести. \ S соответствует довольно многим пробельным символам.
Попробуйте сделать теги mb_convert_encoding и strip, ПОСЛЕ удаления пространства.
Я применил регулярное выражение перед выполнением mb_convert_encoding() но между строкой осталось несколько пробелов
Вы делали мой код foreach выше? Это даст код символа каждого символа, который позволит нам идентифицировать пробелы.
это дает мне выходной, как это: int (0) int (229) int (174) int (156) int (58) int (231) int (144) int (134) int (233) int (171) int (174) ) int (38) int (110) int (98) int (115) int (112) ...... Так как же определить пространство?
Как я и подозревал. Ни один из тех не пробелы. Pre_replace действительно работает. Есть некоторые символы, которые браузер не может отобразить.

h3lL0W0RLd · Accepted Answer · 2015-01-27T10-56-00.000Z

Просто обнаружил, что белое пространство было   при просмотре источника. Таким образом, код просто становится str_replace(' ', '', $html_content);