Поиск MySQL столбец для похожих слов

Question

Поиск MySQL столбец для похожих слов

0

Есть ли способ не допустить, чтобы MySQL отличался от ч/б строк, таких как "Убить Билла: Том 2" и "Убить Билла: Том II"? Я создаю веб-скребок, который скрежет фильмов с разных сайтов и хранит их в базе данных. Поскольку разные сайты используют разные заголовки много раз, есть ли способ игнорировать эти незначительные различия в строках?

Soundex звучит многообещающе, но это не так эффективно для неанглийских строк.

Другой пример: "Падмаават" и "Падмават". Soundex может быть эффективным здесь, но мне нужно более надежное решение.

Спасибо!

Prashant Pandey 06 апр. 2018, в 00:44

Источник

Теги:

mysql

database

1 ответ

Ещё вопросы

spencer7593 · Answer 1 · 2018-04-05T21-21-00.000Z

Нет, для MySQL нет встроенной функции в MySQL (т.е. Для того, чтобы рассматривать строки "Vol.2" и "Vol II" как совпадение.)

Там встроенная функция SOUNDEX, но она делает только то, что она делает. Это может быть частью решения.

Возможно, вы сможете реализовать алгоритм сопоставления строк в качестве рулонных собственных хранимых программ MySQL. Но, угххх. Алгоритмы сопоставления строк, вероятно, лучше реализованы в слое, отличном от реляционной базы данных.