Извлечение массива C #

2

У меня есть массив байтов, и я хочу определить, существует ли содержимое этого массива байтов в другом более крупном массиве как непрерывная последовательность. Каков самый простой способ сделать это?

Теги:
algorithm
search
bytearray

3 ответа

3
Лучший ответ

Наивный подход:

public static bool IsSubsetOf(byte[] set, byte[] subset) {
    for(int i = 0; i < set.Length && i + subset.Length <= set.Length; ++i)
        if (set.Skip(i).Take(subset.Length).SequenceEqual(subset))
            return true;
    return false;
}

Для более эффективных подходов вы можете рассмотреть более сложные алгоритмы сопоставления строк, такие как KMP.

  • 1
    Это ужасно неэффективно ...
  • 1
    @Michal: Это O (n * m), что может показаться неэффективным, но если вы беспокоитесь о Skip and Take, не надо. Это так же эффективно, как пара для петель. Как я уже сказал, если производительность является проблемой, вы должны рассмотреть более продвинутый алгоритм.
Показать ещё 3 комментария
3

Попробуйте адаптировать некоторый строковый алгоритм поиска. Один из самых быстрых Boyer-Moore. Это довольно легко. Для двоичных данных алгоритм Knuth-Morris-Pratt может работать очень эффективно.

0

Это, что является 1/1 портом этого ответа: Поиск последовательности байтов в двоичном файле с Java

Это очень эффективный способ:

public static class KmpSearch {

    public static int IndexOf(byte[] data, byte[] pattern) {
        int[] failure = ComputeFailure(pattern);

        int j = 0;
        if (data.Length == 0) return -1;

        for (int i = 0; i < data.Length; i++) {
            while (j > 0 && pattern[j] != data[i]) {
                j = failure[j - 1];
            }
            if (pattern[j] == data[i]) { j++; }
            if (j == pattern.Length) {
                return i - pattern.Length + 1;
            }
        }
        return -1;
    }


    private static int[] ComputeFailure(byte[] pattern) {
        int[] failure = new int[pattern.Length];

        int j = 0;
        for (int i = 1; i < pattern.Length; i++) {
            while (j > 0 && pattern[j] != pattern[i]) {
                j = failure[j - 1];
            }
            if (pattern[j] == pattern[i]) {
                j++;
            }
            failure[i] = j;
        }

        return failure;
    }
}

Ещё вопросы

Сообщество Overcoder
Наверх
Меню