Почему при инициализации словаря не происходит переполнение памяти?

Question

Почему при инициализации словаря не происходит переполнение памяти?

1

Справочная информация. Словарь использует функцию хеширования для генерации индекса для каждого введенного вами значения.

Говоря, что индекс уникален в случае каждого ввода, мне просто интересно, что может быть точной функцией Хэша, которая генерирует уникальное значение для каждого входа?
Предположим, что (как я не уверен в этом) существует хеш-функция, которая генерирует уникальный индекс для каждого входа. Затем, какой размер будет инициализирован Словарем? Я предполагаю, что он динамичен, но что, если один индекс равен 10, а для другого ввода - 123456? Он должен использовать массив размером 123457 - не приведет ли это к переполнению памяти?

PS: У меня есть теоретические знания о том, что такое функция Хэша и что она делает, но я не видел ее фактической реализации. Кроме того, так как многие языки имеют встроенные структуры данных для этой цели, это сделало меня любопытством :)

mkkhedawat 26 нояб. 2014, в 07:54

Источник

0

Вы спрашиваете о Java или C #?
Eran 26 нояб. 2014, в 06:24
0

Кто угодно. Я больше заинтересован в реализации, чем конкретный язык?
mkkhedawat 26 нояб. 2014, в 06:25
0

Оба вопроса № 1 и № 2 относятся к конкретному типу хеширования, то есть «идеальному хешу». В общем, это не так , что вы получите хэш - функцию , которая возвращает уникальное значение для каждого входа. Что касается вопроса «переполнения», этого не происходит, потому что длина хеш-таблицы не имеет ничего общего с диапазоном значений, возвращаемых хеш-функцией. Любое более глубокое обсуждение этого вопроса здесь действительно не по теме. Вам будет лучше читать Википедию или другие ссылки.
Peter Duniho 26 нояб. 2014, в 06:46
0

Очевидно, я сделал Google, прежде чем писать этот длинный вопрос.
mkkhedawat 26 нояб. 2014, в 07:38

Показать ещё 2 комментария

Теги:

c#

java

dictionary

data-structures

hash

1 ответ

Ещё вопросы

Кто угодно. Я больше заинтересован в реализации, чем конкретный язык?
Оба вопроса № 1 и № 2 относятся к конкретному типу хеширования, то есть «идеальному хешу». В общем, это не так , что вы получите хэш - функцию , которая возвращает уникальное значение для каждого входа. Что касается вопроса «переполнения», этого не происходит, потому что длина хеш-таблицы не имеет ничего общего с диапазоном значений, возвращаемых хеш-функцией. Любое более глубокое обсуждение этого вопроса здесь действительно не по теме. Вам будет лучше читать Википедию или другие ссылки.
Очевидно, я сделал Google, прежде чем писать этот длинный вопрос.

Eran · Accepted Answer · 2014-11-26T05-43-00.000Z

Вы ошибаетесь в предположении об уникальности хэш-функции.

Если взять, например, HashMap Java, он использует hashCode() ключа и применяет к нему дополнительную хэш-функцию (для защиты от хэш-функций низкого качества). Затем берется вычисляемое значение хеша и сопоставляет его с индексом в хранилище карты, который обычно намного меньше хэш-значения.

Поэтому, даже если хеш-функция вернет уникальное значение для каждого ключа (чего ему не требуется), HashMap все равно нормализует это значение до гораздо меньшего индекса хранилища HashMap. Поэтому нет переполнения (если вы не вставляете слишком много элементов в Map).

Что произойдет, если вы получите один и тот же индекс для разных входов после нормализации? Я прочитал, в этом случае вы ищете следующий пустой индекс или аналогичный. (Поправьте меня если я не прав). Сомнение здесь при поиске, как я узнаю, что это правильный индекс, или мне нужно искать следующий?
@Manish Способ реализации HashMap, индекс на карте содержит связанный список всех пар (ключ, значение), которые были сопоставлены с ним. Как только вы достигнете связанного списка индекса, вы будете перебирать список, пока не найдете нужный ключ. Идея состоит в том, что в среднем списки будут очень короткими по сравнению с общим количеством элементов на карте, и поэтому поиск будет принимать в среднем O (1).