hash — Основные вопросы MurmurHash: описание переменных для len, ключ к реализации C ++

Я пытаюсь адаптировать MurmurHash в программу, созданную для класса, но я не могу найти явного подтверждения того, что представляют переменные.

Я использую следующее в качестве ссылки:

unsigned int MurmurHash2 ( const void * key, int len, unsigned int seed )
{
// 'm' and 'r' are mixing constants generated offline.
// They're not really 'magic', they just happen to work well.

const unsigned int m = 0x5bd1e995;
const int r = 24;

// Initialize the hash to a 'random' value

unsigned int h = seed ^ len;

// Mix 4 bytes at a time into the hash

const unsigned char * data = (const unsigned char *)key;

while(len >= 4)
{
unsigned int k = *(unsigned int *)data;

k *= m;
k ^= k >> r;
k *= m;

h *= m;
h ^= k;

data += 4;
len -= 4;
}

// Handle the last few bytes of the input array

switch(len)
{
case 3: h ^= data[2] << 16;
case 2: h ^= data[1] << 8;
case 1: h ^= data[0];
h *= m;
};

// Do a few final mixes of the hash to ensure the last few
// bytes are well-incorporated.

h ^= h >> 13;
h *= m;
h ^= h >> 15;

return h;
}

Насколько я понимаю, хеш-функции примут какое-то значение и поместят его в хеш-таблицу. Является ли «len» размером хеш-таблицы, а «key» — значением, подлежащим хешированию?

0

Решение

Вот что они представляют:

unsigned int MurmurHash2 ( const void * key, int len, unsigned int seed )

key — Указывает на массив байтов, для которого вы хотите сгенерировать хеш-значение

len — количество байтов, которые key указывает на (или, по крайней мере, на количество байтов, которые вы хотите включить во входные данные, из которых вычисляется значение хеша)

seed — выберите любое значение, которое вы хотите для этого; вы получите разные хеш-коды для данного ввода, если вы используете разные начальные значения. Если есть сомнения, просто всегда переходите в ноль.

Возвращает значение хеша, вычисленное из переданных байтов. Вы всегда получите одно и то же значение хеш-функции для одной и той же последовательности байтов (при условии, что вы также передали одно и то же seed значение), но возвращаемое значение хеш-функции будет значительно различаться для разных последовательностей байтов (т. е. даже небольшая разница во входных байтах, вероятно, приведет к очень разному возвращаемому хэш-значению)

Насколько я понимаю, хеш-функции примут какое-то значение и поместят его
в хеш-таблицу. Является ли «len» размер хеш-таблицы и «ключ»
значение для хеширования?

Это неверно MurmurHash2 () просто вычисляет хеш-код, и поэтому MurmurHash2 () может быть полезен как часть реализации хеш-таблицы, но сам не реализует хеш-таблицу.

0

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]