Я пытаюсь запустить openmp реализацию алгоритма Дейкстры, которую я скачал здесь heather.cs.ucdavis.edu/~matloff/OpenMP/Dijkstra.c
Если я добавлю, например, еще одну вершину от 5 до 6, чтобы путь от 0-го проходил через две вершины, моя программа не сможет дать мне правильный результат, сказав, что расстояние между 0-м и 6-м бесконечно: ^ (
В чем может быть причина?
#define LARGEINT 2<<30-1 // "infinity"#define NV 6
// global variables, all shared by all threads by default
int ohd[NV][NV], // 1-hop distances between vertices
mind[NV], // min distances found so far
notdone[NV], // vertices not checked yet
nth, // number of threads
chunk, // number of vertices handled by each thread
md, // current min over all threads
mv; // vertex which achieves that min
void init(int ac, char **av)
{ int i,j;
for (i = 0; i < NV; i++)
for (j = 0; j < NV; j++) {
if (j == i) ohd[i][i] = 0;
else ohd[i][j] = LARGEINT;
}
ohd[0][1] = ohd[1][0] = 40;
ohd[0][2] = ohd[2][0] = 15;
ohd[1][2] = ohd[2][1] = 20;
ohd[1][3] = ohd[3][1] = 10;
ohd[1][4] = ohd[4][1] = 25;
ohd[2][3] = ohd[3][2] = 100;
ohd[1][5] = ohd[5][1] = 6;
ohd[4][5] = ohd[5][4] = 8;
for (i = 1; i < NV; i++) {
notdone[i] = 1;
mind[i] = ohd[0][i];
}
}
// finds closest to 0 among notdone, among s through e
void findmymin(int s, int e, int *d, int *v)
{ int i;
*d = LARGEINT;
for (i = s; i <= e; i++)
if (notdone[i] && mind[i] < *d) {
*d = ohd[0][i];
*v = i;
}
}
// for each i in [s,e], ask whether a shorter path to i exists, through
// mv
void updateohd(int s, int e)
{ int i;
for (i = s; i <= e; i++)
if (mind[mv] + ohd[mv][i] < mind[i])
mind[i] = mind[mv] + ohd[mv][i];
}
void dowork()
{
#pragma omp parallel // Note 1
{ int startv,endv, // start, end vertices for this thread
step, // whole procedure goes NV steps
mymd, // min value found by this thread
mymv, // vertex which attains that value
me = omp_get_thread_num(); // my thread number
#pragma omp single // Note 2
{ nth = omp_get_num_threads(); chunk = NV/nth;
printf("there are %d threads\n",nth); }
// Note 3
startv = me * chunk;
endv = startv + chunk - 1;
for (step = 0; step < NV; step++) {
// find closest vertex to 0 among notdone; each thread finds
// closest in its group, then we find overall closest
#pragma omp single
{ md = LARGEINT; mv = 0; }
findmymin(startv,endv,&mymd,&mymv);
// update overall min if mine is smaller
#pragma omp critical // Note 4
{ if (mymd < md)
{ md = mymd; mv = mymv; }
}
// mark new vertex as done
#pragma omp single
{ notdone[mv] = 0; }
// now update my section of ohd
updateohd(startv,endv);
#pragma omp barrier
}
}
}
int main(int argc, char **argv)
{ int i;
init(argc,argv);
dowork();
// back to single thread now
printf("minimum distances:\n");
for (i = 1; i < NV; i++)
printf("%d\n",mind[i]);
}
Здесь есть две проблемы:
Если количество потоков не делит поровну количество значений, то это разделение работы
startv = me * chunk;
endv = startv + chunk - 1;
собирается покинуть последний (NV - nth*(NV/nth))
элементы отменены, что будет означать, что расстояния остаются в LARGEINT
, Это можно исправить любым количеством способов; самое простое сейчас — передать всю оставшуюся работу последнему потоку
if (me == (nth-1)) endv = NV-1;
(Это приводит к большему дисбалансу нагрузки, чем это необходимо, но это разумное начало, чтобы заставить код работать.)
Другая проблема заключается в том, что перед установкой барьер был исключен. notdone[]
#pragma omp barrier
#pragma omp single
{ notdone[mv] = 0; }
Это гарантирует notdone
обновляется и updateohd()
запускается только после того, как все закончили findmymin()
и обновил md
а также mv
,
Обратите внимание, что очень легко вносить ошибки в исходный код, с которого вы начали; используемые глобальные переменные очень затрудняют рассуждение. Джон Буркардт имеет лучшая версия об этом же алгоритме обучения на его веб-сайте, который почти чрезмерно хорошо прокомментирован и легче прослеживается.
Других решений пока нет …