Я пытаюсь вычислить сходство в процентах между входной строкой и данным набором строк. Я видел примеры, использующие расстояние на расстоянии и расстояние от левенштейна. Но они учитывают только два укуса.
Мой вопрос: Можно вычислить вышеупомянутое для нескольких укусов сразу? (У меня есть набор сохраненных строк, я получаю новое входное жало, и я хочу узнать, как похожий старый укус на новый, или укус, который соответствует 90%). Я полагаю, что расстояние от хамминга будет уместным, поскольку все строки имеют одинаковую длину.
Например: Предположим, что вход: ATTACGCT
Existing: A A T T G T C
A C T T G T C
C A T T G T C
Хотя есть много похожих вопросов, я не смог найти тот, который учитывает это. Может, кто-то может помочь.
Заранее спасибо!
Вы можете использовать это: levenshtein
Проверьте документ, чтобы иметь пример, надеюсь, что он вам поможет.