Мне было интересно, можно ли будет использовать SSE параллельно с x87. Итак, рассмотрим следующий псевдокод,
1: sse_insn
2: x87_insn
Будет ли конвейер выполнять 1 и 2 параллельно, предполагая, что они могут выполняться параллельно?
Во всех современных (и более старых) процессорах инструкции x87 и SSE используют одни и те же блоки выполнения, поэтому НЕПРАВИЛЬНО вы получите много пользы от такого рода кода. Могут быть очень особые случаи, когда вы можете заставить процессор запустить, например, деление x87 параллельно с добавлением SSE, или что-то в этом роде, но если вы просто выполняете большой цикл подобных операций, вы почти наверняка не получите никакой выгоды. ,
Других решений пока нет …