float a[4] = {1,2,3,4}, b[4] = {4,3,2,1};
uint32_t c[4];
int main() {
__m128 pa = _mm_loadu_ps(a);
__m128 pb = _mm_loadu_ps(b);
__m128 pc = _mm_cmpgt_ps(pa, pb);
_mm_storeu_ps((float*)c, pc);
for (int i = 0;i < 4; ++i) printf("%u\n", c[i]);
return 0;
}
какова правильная инструкция _mm_storeu_ps((float*)c, pc)
?
здесь с — целочисленный массив … я не думаю, что этот путь хорош, лучше?
Есть две инструкции по конвертации __m128
(float
вектор) в __m128i
(int32_t
вектор) в SSE2: _mm_cvtps_epi32
(с округлением) и _mm_cvttps_epi32
(с усечением).
__m128i vi = _mm_cvttps_epi32(pc);
_mm_storeu_si128((__m128i *)c, vi);
Если вы не можете использовать SSE2, вы должны конвертировать float
массив для int
массив после хранения pc
в float
массив.
float d[4];
_mm_storeu_ps(d, pc);
c[0] = (int)d[0]; c[1] = (int)d[1]; c[2] = (int)d[2]; c[3] = (int)d[3];
Других решений пока нет …