Мне нужно рассчитать 2 разные функции, которые используют одни и те же параметры (только для чтения). После того, как я сделал программу многопоточной, запуск программы требует 2 раза (вместо 0,5). Я новичок в многопоточном программировании, но я подозревал false sharing
,
Мой оригинальный код (вырезано):
#include <iostream>
double frac_twins(double mu, double sigma,p){
return 1;
}
double dist_twins(double mu, double sigma,p){
return 2;
}
int main(){
int n_t=100;
double* num_t = new double[n_t];
double* dist_t = new double[n_t];
double mu=2; double sigma=1;
double num,dist;
for(double p=0.001; p<=0.101;p+=0.001){
num=frac_twins(mu,sigma,p);
dist=dist_twins(mu,sigma,p);
num_t[i]=num;
dist_t[i]=dist;
i++;
}
return 0;
}
Работает отлично. Тогда я попытался использовать темы:
#include <iostream>
#include <thread>
double frac_twins(double mu, double sigma,p){
return 1;
}
double dist_twins(double mu, double sigma,p){
return 2;
}
int main(){
int n_t=100;
double* num_t = new double[n_t];
double* dist_t = new double[n_t];
double mu=2; double sigma=1;
double num,dist;
for(double p=0.001; p<=0.101;p+=0.001){
std::thread t1([&num,mu,sigma,p](){
num=frac_twins(mu,sigma,p);
});
std::thread t2([&dist,mu,sigma,p](){
dist=dist_twins(mu,sigma,p);
});
t1.join();
t2.join();
num_t[i]=num;
dist_t[i]=dist;
i++;
}
return 0;
}
Который работает, но в 2 раза медленнее. Затем я попытался «освободить» переменные mu, sigma и p, но это все равно в 2 раза медленнее:
#include <iostream>
#include <thread>
double frac_twins(double mu, double sigma,p){
return 1;
}
double dist_twins(double mu, double sigma,p){
return 2;
}
int main(){
int n_t=100;
double* num_t = new double[n_t];
double* dist_t = new double[n_t];
double mu=2; double sigma=1;
double mu2=2; double sigma2=1; double p2;
double num,dist;
for(double p=0.001; p<=0.101;p+=0.001){
std::thread t1([&num,mu,sigma,p](){
num=frac_twins(mu,sigma,p);
});
mu2=mu; sigma2=sigma; p2=p;
std::thread t2([&dist,mu2,sigma2,p2](){
dist=dist_twins(mu,sigma,p);
});
t1.join();
t2.join();
num_t[i]=num;
dist_t[i]=dist;
i++;
}
return 0;
}
Функции, которые вы вызываете в своих потоках, выполняют так мало работы, что стоимость запуска этих потоков превышает выгоду, которую вы получаете, используя несколько потоков. Ложный обмен не имеет к этому никакого отношения.
поскольку mu
, sigma
, а также p
передаются по значению, они могут быть разделены между двумя потоками (и, в любом случае, копируются как часть служебных данных лямбда-функции).
Других решений пока нет …