Функция хеширования, совместимая с Arrays.hashCode

Question

Функция хеширования, совместимая с Arrays.hashCode

1

Я переношу нагрузку кода, чтобы остановить передачу байтов [] s, InputStreams и InputSuppliers и просто использовать ByteSource.

В настоящее время код вычисляет и ETag для данных, используя Arrays.hashCode в сыром байте [], что переводится с помощью ByteSource:

Arrays.hashCode(dataSource.read());

Проблема заключается в том, что dataSource.read() в ByteArrayInputSource клонирует базовый байт [], что хуже, чем в настоящее время.

Я хотел бы использовать dataSource.hash(HashFunction) но я хочу убедиться, что я не разрушаю ETags, сгенерированные с помощью hashCode, так как это приведет к недействительности кэша.

Кто-нибудь знает о HashFunction, который выполняет эту работу для меня?

Ben Smith 25 апр. 2014, в 18:23

Источник

0

Почему бы вам не реализовать вычисление хеша, как описано в документации API Arrays.hashCode?
jarnbjo 25 апр. 2014, в 16:19
0

Я могу, но я бы хотел расширить AbstractNonStreamingHashFunction, которая является пакетной, досадно.
Ben Smith 25 апр. 2014, в 16:20

Теги:

java

hashcode

guava

bytearray

1 ответ

Ещё вопросы

Почему бы вам не реализовать вычисление хеша, как описано в документации API Arrays.hashCode?
Я могу, но я бы хотел расширить AbstractNonStreamingHashFunction, которая является пакетной, досадно.

ColinD · Accepted Answer · 2014-04-25T14-48-00.000Z

Я не знаю какой-либо уже доступной функции HashFunction которая будет делать то, что вы хотите, но ее очень легко написать. Что-то вроде:

public final class ByteArrayHashFunction extends AbstractStreamingHashFunction {

  @Override
  public Hasher newHasher() {
    return new ByteArrayHasher();
  }

  @Override
  public int bits() {
    return 32;
  }

  private static final class ByteArrayHasher extends AbstractByteHasher {

    private int hash = 1;

    @Override
    protected void update(byte b) {
      hash = 31 * hash + b;
    }

    @Override
    public HashCode hash() {
      return HashCode.fromInt(hash);
    }
  }
}

Однако вам нужно будет скопировать несколько абстрактных классов из common.hash в ваш собственный пакет.

Да, к такому выводу я пришел. На самом деле мне нужно только реализовать hashBytes (), поэтому я просто вызвал Arrays.hashCode через это.
@BenSmith: Предполагая, что вы ссылаетесь на AbstractNonStreamingHashFunction , я настоятельно рекомендую использовать AbstractStreamingHashFunction как я это сделал здесь. AbstractNonStreamingHashFunction (как следует из «не потоковой» части имени) не работает хорошо для обработки потока байтов. Он предназначен для хеш-функций, которые должны обрабатывать набор байтов одновременно, и поэтому он буферизует все, что ему записано, до тех пор, пока вы не вызовете hash() . С другой стороны, алгоритм, который использует Arrays.hashCode , очень удобен для потоковой передачи.
Да, я ценю это. Возможно, мне следует обратиться к хэш-функции Streaming, но поскольку ByteSource почти всегда оборачивает байтовый массив, это не имеет большого значения.
@BenSmith: Верно, когда ByteSource оборачивает байтовый массив, не потоковая версия будет даже немного быстрее.