Процентное сходство между набором строк

0

Я пытаюсь вычислить сходство в процентах между входной строкой и данным набором строк. Я видел примеры, использующие расстояние на расстоянии и расстояние от левенштейна. Но они учитывают только два укуса.

Мой вопрос: Можно вычислить вышеупомянутое для нескольких укусов сразу? (У меня есть набор сохраненных строк, я получаю новое входное жало, и я хочу узнать, как похожий старый укус на новый, или укус, который соответствует 90%). Я полагаю, что расстояние от хамминга будет уместным, поскольку все строки имеют одинаковую длину.

Например: Предположим, что вход: ATTACGCT

         Existing: A A T T G T C
                   A C T T G T C
                   C A T T G T C

Хотя есть много похожих вопросов, я не смог найти тот, который учитывает это. Может, кто-то может помочь.

Заранее спасибо!

  • 0
    почему вы ставите тег sql?
Теги:

1 ответ

0

Вы можете использовать это: levenshtein

Проверьте документ, чтобы иметь пример, надеюсь, что он вам поможет.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню