У меня есть шаблон структуры, который принимает два типа (T
а также S
), и в какой-то момент использует static_cast
конвертировать из одного типа в другой. Часто бывает так, что T
а также S
того же типа.
Упрощенный пример настройки:
template <typename T, typename S = T>
struct foo
{
void bar(T val)
{
/* ... */
some_other_function(static_cast<S>(val));
/* ... */
}
};
В том случае, если S
тот же класс, что и T
, делает или может static_cast
ввести дополнительные издержки или это нулевая операция, которая всегда будет игнорироваться?
Если это действительно приводит к накладным расходам, есть ли простой трюк метапрограммирования шаблона для выполнения static_cast
только при необходимости, или мне нужно будет создать частичную специализацию, чтобы справиться с T == S
дело? Я бы предпочел избежать частичной специализации всего foo
Шаблон по возможности.
Да, оно может.
Вот пример:
struct A {
A( A const& ) {
std::cout << "expensive copy\n";
}
};
template<typename T>
void noop( T const& ) {}
template <typename T, typename S = T>
void bar(T val)
{
noop(static_cast<S>(val));
}
template <typename T>
void bar2(T val)
{
noop(val);
}
int main() {
std::cout << "start\n";
A a;
std::cout << "bar2\n";
bar2(a); // one expensive copy
std::cout << "bar\n";
bar(a); // two expensive copies
std::cout << "done";
}
в основном static_cast
может вызвать конструктор копирования для вызова.
Для некоторых типов (например, int
), конструктор копирования в основном бесплатен, и компилятор может его устранить.
Для других типов это не может. В этом контексте, elision copy также недопустима: если ваш конструктор копирования имеет побочные эффекты, или компилятор не может доказать, что у него нет побочных эффектов (обычно, если конструктор копирования нетривиален), он будет вызван.
Дополнять Ответ Якка, Я решил опубликовать сборку, чтобы подтвердить это. Я использовал std::string
как тип теста.
foo<std::string>.bar()
— Нет кастинга
pushq %rbp
movq %rsp, %rbp
subq $32, %rsp
movq %rcx, 16(%rbp)
movq %rdx, 24(%rbp)
movq 24(%rbp), %rax
movq %rax, %rcx
call _Z19some_other_functionRKSs
nop
addq $32, %rsp
popq %rbp
ret
foo<std::string>.bar()
— static_cast<T>()
pushq %rbp
pushq %rbx
subq $56, %rsp
leaq 128(%rsp), %rbp
movq %rcx, -48(%rbp)
movq %rdx, -40(%rbp)
movq -40(%rbp), %rdx
leaq -96(%rbp), %rax
movq %rax, %rcx
call _ZNSsC1ERKSs // std::string.string()
leaq -96(%rbp), %rax
movq %rax, %rcx
call _Z19some_other_functionRKSs
leaq -96(%rbp), %rax
movq %rax, %rcx
call _ZNSsD1Ev // std::string.~string()
jmp .L12
movq %rax, %rbx
leaq -96(%rbp), %rax
movq %rax, %rcx
call _ZNSsD1Ev // std::string.~string()
movq %rbx, %rax
movq %rax, %rcx
call _Unwind_Resume
nop
.L12:
addq $56, %rsp
popq %rbx
popq %rbp
ret
Этот код генерируется только с -O0
, Любой уровень оптимизации сравним два случая.