Мне нужна реализация хэш-функции, ориентированная на производительность, в С++ для хэш-таблицы, которую я буду кодировать. Я уже озирался и только задавал вопросы, спрашивая, какая хорошая хэш-функция "вообще". Я рассматривал CRC32 (но где найти хорошую реализацию?) И несколько криптографических алгоритмов. Однако моя таблица имеет очень специфические требования.
Здесь будет выглядеть таблица:
100,000 items max
200,000 capacity (so the load is 0.5)
hashing a 6-character string which is a part of English sentence
examples: "become" "and he" ", not "
Первым приоритетом моей хэш-таблицы является быстрый поиск (поиск). Быстрая вставка не важна, но она будет сопровождаться быстрым поиском. Удаление не имеет значения, и повторное хеширование - это не то, что я буду изучать. Для обработки столкновений я, вероятно, буду использовать отдельную цепочку, как описано здесь. Я уже рассмотрел эту статью, но хотел бы получить мнение тех, кто ранее занимался такой задачей.