Есть ли более эффективная реализация для двунаправленной карты?

Question

Есть ли более эффективная реализация для двунаправленной карты?

Я создал простой двунаправленная карта класс, который работает путем внутреннего хранения двух std::map экземпляры с противоположными типами ключ / значение и обеспечивающие дружественный интерфейс:

template<class T1, class T2> class Bimap
{
std::map<T1, T2> map1;
std::map<T2, T1> map2;
// ...
};

Есть ли более эффективный метод реализации двунаправленной карты, который не требует вдвое больше памяти?
Как обычно реализуется bimap?

РЕДАКТИРОВАТЬ:

Должен ли элемент bimap быть изменчивым или неизменным? (Изменение одного элемента в map1 следует изменить ключ в map2, но ключи постоянные и это невозможно — какое решение?)
Владение элементами также является еще одной проблемой: когда пользователь вставляет пару ключ-значение в bimap, bimap должен сделать копию этой пары ключ-значение и сохранить ее, тогда внутренняя вторая карта (с инвертированным ключом / значением) должна не копировать, а указать исходную пару. Как этого достичь?

РЕДАКТИРОВАТЬ 2:

Я опубликовал возможную реализацию, которую я сделал на Code Review.

37

bimap c++c++11 data-structures map

Решение

Другие решения

Было бы более эффективно хранить все элементы в векторе и иметь 2 карты <T1*,T2*> а также <T2*,T1*> таким образом, вы не скопировали бы все дважды.

На мой взгляд, вы пытаетесь сохранить 2 вещи, сами элементы и отношения между ними, если вы стремитесь к скалярным типам, вы можете оставить это как 2 карты, но если вы хотите обрабатывать сложные типы, то имеет больше смысла отделить хранилище от отношений и обрабатывать отношения вне хранилища.

16

Boost Bimap использует Boost Mutant Idiom.

Со связанной страницы википедии:

Идиома Boost мутант использует reinterpret_cast и сильно зависит от предположения, что схемы памяти двух разных структур с одинаковыми элементами данных (типы и порядок) являются взаимозаменяемыми. Хотя стандарт C ++ не гарантирует это свойство, его удовлетворяют практически все компиляторы.

template <class Pair>
struct Reverse
{
typedef typename Pair::first_type  second_type;
typedef typename Pair::second_type first_type;
second_type second;
first_type first;
};

template <class Pair>
Reverse<Pair> & mutate(Pair & p)
{
return reinterpret_cast<Reverse<Pair> &>(p);
}

int main(void)
{
std::pair<double, int> p(1.34, 5);

std::cout << "p.first = " << p.first << ", p.second = "  << p.second << std::endl;
std::cout << "mutate(p).first = " << mutate(p).first << ", mutate(p).second = "  << mutate(p).second << std::endl;
}

Реализация в форсированных источниках, конечно, довольно привлекательна.

13

Если вы создаете набор пар для ваших типов std::set<std::pair<X,Y>> Вы в значительной степени реализовали свою функциональность и правила о настройке мутабильности и константности (ОК, может быть, настройки не те, что вы хотите, но настройки могут быть сделаны). Итак, вот код:

#ifndef MYBIMAP_HPP
#define MYBIMAP_HPP

#include <set>
#include <utility>
#include <algorithm>

using std::make_pair;

template<typename X, typename Y, typename Xless = std::less<X>,
typename Yless = std::less<Y>>
class bimap
{
typedef std::pair<X, Y>                             key_type;
typedef std::pair<X, Y>                             value_type;
typedef typename std::set<key_type>::iterator       iterator;
typedef typename std::set<key_type>::const_iterator const_iterator;

struct Xcomp
{
bool operator()(X const &x1, X const &x2)
{
return !Xless()(x1, x2) && !Xless()(x2, x1);
}
};
struct Ycomp
{
bool operator()(Y const &y1, Y const &y2)
{
return !Yless()(y1, y2) && !Yless()(y2, y1);
}
};
struct Fless
{ // prevents lexicographical comparison for std::pair, so that
// every .first value is unique as if it was in its own map
bool operator()(key_type const &lhs, key_type const &rhs)
{
return Xless()(lhs.first, rhs.first);
}
};
/// key and value type are interchangeable
std::set<std::pair<X, Y>, Fless> _data;

public:
std::pair<iterator, bool> insert(X const &x, Y const &y)
{
auto it = find_right(y);
if (it == end()) { // every .second value is unique
return _data.insert(make_pair(x, y));
}
return make_pair(it, false);
}
iterator find_left(X const &val)
{
return _data.find(make_pair(val,Y()));
}
iterator find_right(Y const &val)
{
return std::find_if(_data.begin(), _data.end(),
[&val](key_type const &kt)
{
return Ycomp()(kt.second, val);
});
}
iterator end()   { return _data.end();   }
iterator begin() { return _data.begin(); }
};

#endif

Пример использования

template<typename X, typename Y, typename In>
void PrintBimapInsertion(X const &x, Y const &y, In const &in)
{
if (in.second) {
std::cout << "Inserted element ("<< in.first->first << ", " << in.first->second << ")\n";
}
else {
std::cout << "Could not insert (" << x << ", " << y
<< ") because (" <<  in.first->first << ", "<< in.first->second << ") already exists\n";
}
}int _tmain(int argc, _TCHAR* argv[])
{
bimap<std::string, int> mb;
PrintBimapInsertion("A", 1, mb.insert("A", 1) );
PrintBimapInsertion("A", 2, mb.insert("A", 2) );
PrintBimapInsertion("b", 2, mb.insert("b", 2));
PrintBimapInsertion("z", 2, mb.insert("z", 2));

auto it1 = mb.find_left("A");
if (it1 != mb.end()) {
std::cout << std::endl << it1->first << ", "<< it1->second << std::endl;
}

auto it2 = mb.find_right(2);
if (it2 != mb.end()) {
std::cout << std::endl << it2->first << ", "<< it2->second << std::endl;
}

return 0;
}

НОТА: Все это грубый набросок кода того, какой будет полная реализация, и даже после полировки и расширения кода я не намекаю, что это будет альтернативой boost::bimap но просто домашний способ иметь ассоциативный контейнер для поиска как по значению, так и по ключу.

Живой пример

6

Одна из возможных реализаций, которая использует промежуточную структуру данных и косвенное обращение:

int sz;  // total elements in the bimap

std::map<A, int> mapA;
std::map<B, int> mapB;

typedef typename std::map<A, int>::iterator iterA;
typedef typename std::map<B, int>::iterator iterB;

std::vector<pair<iterA, iterB>> register;
// All the operations on bimap are indirected through it.

вставка

Предположим, вам нужно вставить (X, Y), где X, Y являются экземплярами A и B соответственно, затем:

Вставить (X, SZ) в mapA — O (LG SZ)
Вставить (Y, SZ) в mapB — O (LG SZ)
затем push_back (IterX, IterY) в register — O (1). Здесь IterX и IterY являются итераторами для соответствующего элемента в mapA а также mapB и получены из (1) и (2) соответственно.

Уважать

Поиск изображения элемента X типа A:

Получить Int сопоставлен с X в mapA, — O (LG N)
Используйте int для индексации register и получите соответствующую IterY. — O (1)
Если у вас есть IterY, вы можете получить Y через IterY->first, — O (1)

Таким образом, обе операции реализованы в O (LG N).

Космос: Все копии объектов A и B должны храниться только один раз. Есть, однако, много бухгалтерии. Но когда у вас есть большие объекты, это также не будет значительным.

ЗаметкаЭта реализация опирается на тот факт, что итераторы карты никогда не аннулируются. Следовательно, содержание register всегда действительны.

Более сложную версию этой реализации можно найти Вот

4

Как насчет этого?

Здесь мы избегаем двойного хранения одного типа (T1). Другой тип (T2) все еще хранится дважды.

// Assume T1 is relatively heavier (e.g. string) than T2 (e.g. int family).
// If not, client should instantiate this the other way.
template <typename T1, typename T2>
class UnorderedBimap {

typedef std::unordered_map<T1, T2> Map1;
Map1 map1_;

std::unordered_map<T2, Map1::iterator> map2_;
};

0

Источник

Accepted Answer

Существует определенная проблема с двойным хранением ваших данных во всех простых реализациях BIMAP. Если вы можете разбить его на кусочек указателей извне, то вы можете легко проигнорировать это и просто сохранить обе карты вида std::map<A*,B*> как уже предложил Аркаитц Хименес (хотя вопреки его ответу вы должны заботиться о хранении снаружи, чтобы избежать A->A* уважать). Но если у вас есть указатели в любом случае, почему бы просто не сохранить std::pair<A,B> в точке, где вы могли бы хранить A а также B по отдельности?

Было бы неплохо иметь std::map<A,B*> вместо std::map<A*,B*> поскольку это позволило бы, например, поиск элемента, связанного со строкой, по вновь созданной строке с тем же содержимым вместо указателя на исходную строку, которая создала пару. Но принято хранить полную копию ключа с каждой записью и полагаться только на хеш, чтобы найти правильное ведро. Таким образом, возвращаемый элемент будет правильным даже в случае хеш-коллизии …

Если вы хотите, чтобы это было быстро и грязно, есть

хакерское решение:

Создать две карты std::map<size_t, A> mapA а также std::map<size_t, B> mapB, При вставке хеша оба элемента должны быть вставлены, чтобы получить ключи к соответствующим картам.
void insert(const A &a, const B &b) {
size_t hashA = std::hash<A>(a);
size_t hashB = std::hash<B>(b);

mapA.insert({hashB, a});
mapB.insert({hashA, b});
}
Поиск осуществляется аналогично.

Используя multimap вместо map и проверка каждого элемента, который вы получаете, с поиском в соответственно другой карте (получить кандидата b от mapAхэш b и смотреть в mapB если он соответствует требуемому ключу, итерируйте к следующему кандидату b в противном случае) это правильная реализация — но все же хакерская на мой взгляд …

Вы можете получить гораздо более приятное решение, используя копии элементов, которые используются для сравнения записей (см. Выше) в качестве единственного хранилища. Хотя немного сложнее разобраться с этим. Разработать:

более хорошее решение:

Создайте два набора пар как std::set<pair<A, B*>> а также std::set<pair<B, A*>> и перегрузить operator< а также operator== учитывать только первый элемент пар (или предоставить соответствующий класс сравнения). Необходимо создать наборы пар вместо карт (которые выглядят одинаково), потому что нам нужна гарантия того, что A а также B всегда будет в тех же позициях в памяти. После вставки pair<A,B> мы разделили его на два элемента, которые вписываются в вышеуказанные наборы.

  std::set<pair<B, A*>> mapA;
std::set<pair<A, B*>> mapB;

void insert(const A &a, const B &b) {
auto aitr = mapA.insert({b, nullptr}).first; // creates first pair
B *bp = &(aitr->first);  // get pointer of our stored copy of b
auto bitr = mapB.insert({a, bp}).first;
// insert second pair {a, pointer_to_b}
A *ap = &(bitr->first);  // update pointer in mapA to point to a
aitr->second = ap;
}

Поиск теперь можно сделать простым std::set поиск и разыменование указателя.

Это более приятное решение похоже на решение, которое использует буст — хотя они и используют анонимные указатели в качестве вторых элементов пар и, следовательно, должны использовать reinterpret_casts.

Обратите внимание, что .second часть пар должна быть изменчивой (поэтому я не уверен std::pair может быть использован), или вы должны добавить еще один слой абстракции (std::set<pair<B, A**>> mapA) даже для этой простой вставки. В обоих решениях вам нужны временные элементы для возврата неконстантных ссылок на элементы.

15