У меня есть база данных, большинство из которых являются HTML-страницами, которые затем используются для показа в приложении.
Мы стремимся создать функцию поиска, но у меня есть некоторые проблемы с ложными срабатываниями из-за результатов, включая HTML-код.
Например, поиск "title" приведет к возврату любых страниц контента с тегом заголовка html
В настоящее время мы используем NSPredicates для выполнения запроса в базе данных Core Data.
Существуют ли какие-либо простые/эффективные способы предотвращения возврата этих результатов?
У меня такая же проблема и на Windows и Android!
Одна идея для iOS - фактически сохранить отдельную текстовую версию, кроме версии HTML. Тогда вы могли бы использовать очень простые (даже если не очень эффективные) предикаты
[NSPredicate predicateWithFormat:@"text CONTAINS[cd] %@", searchText];
Более эффективный способ состоял бы в том, чтобы разбить слова и сохранить их в нижнем регистре в индексированном атрибуте другого объекта.
В обоих случаях разбор должен выполняться заранее через одну из доступных библиотек (см., Например, ссылку в комментарии).