У меня есть массив байтов, и я хочу определить, существует ли содержимое этого массива байтов в другом более крупном массиве как непрерывная последовательность. Каков самый простой способ сделать это?
Наивный подход:
public static bool IsSubsetOf(byte[] set, byte[] subset) {
for(int i = 0; i < set.Length && i + subset.Length <= set.Length; ++i)
if (set.Skip(i).Take(subset.Length).SequenceEqual(subset))
return true;
return false;
}
Для более эффективных подходов вы можете рассмотреть более сложные алгоритмы сопоставления строк, такие как KMP.
Попробуйте адаптировать некоторый строковый алгоритм поиска. Один из самых быстрых Boyer-Moore. Это довольно легко. Для двоичных данных алгоритм Knuth-Morris-Pratt может работать очень эффективно.
Это, что является 1/1 портом этого ответа: Поиск последовательности байтов в двоичном файле с Java
Это очень эффективный способ:
public static class KmpSearch {
public static int IndexOf(byte[] data, byte[] pattern) {
int[] failure = ComputeFailure(pattern);
int j = 0;
if (data.Length == 0) return -1;
for (int i = 0; i < data.Length; i++) {
while (j > 0 && pattern[j] != data[i]) {
j = failure[j - 1];
}
if (pattern[j] == data[i]) { j++; }
if (j == pattern.Length) {
return i - pattern.Length + 1;
}
}
return -1;
}
private static int[] ComputeFailure(byte[] pattern) {
int[] failure = new int[pattern.Length];
int j = 0;
for (int i = 1; i < pattern.Length; i++) {
while (j > 0 && pattern[j] != pattern[i]) {
j = failure[j - 1];
}
if (pattern[j] == pattern[i]) {
j++;
}
failure[i] = j;
}
return failure;
}
}