Процентное сходство между набором строк

Question

Процентное сходство между набором строк

0

Я пытаюсь вычислить сходство в процентах между входной строкой и данным набором строк. Я видел примеры, использующие расстояние на расстоянии и расстояние от левенштейна. Но они учитывают только два укуса.

Мой вопрос: Можно вычислить вышеупомянутое для нескольких укусов сразу? (У меня есть набор сохраненных строк, я получаю новое входное жало, и я хочу узнать, как похожий старый укус на новый, или укус, который соответствует 90%). Я полагаю, что расстояние от хамминга будет уместным, поскольку все строки имеют одинаковую длину.

Например: Предположим, что вход: ATTACGCT

         Existing: A A T T G T C
                   A C T T G T C
                   C A T T G T C

Хотя есть много похожих вопросов, я не смог найти тот, который учитывает это. Может, кто-то может помочь.

Заранее спасибо!

Jay 17 нояб. 2014, в 16:13

Источник

0

почему вы ставите тег sql?
al_kash 17 нояб. 2014, в 14:44

Теги:

php

sql

1 ответ

Ещё вопросы

Benjamin Poignant · Answer 1 · 2014-11-17T12-45-00.000Z

Вы можете использовать это: levenshtein

Проверьте документ, чтобы иметь пример, надеюсь, что он вам поможет.