Я читаю презентацию Скотта Майора, он упоминает эту строку:
Обратная сторона встраивания: дублирование кода уменьшает эффективный размер кэша
Я не вижу, как дублирование кода имеет какое-либо отношение к эффективному размеру кэша
Дублирующий код означает, что одни и те же инструкции дублируются на последовательных адресах памяти вместо того, чтобы иметь одну единственную копию этих инструкций в теле цикла. Это означает, что многие строки кэша заполнены одним и тем же контентом, а не несколькими. Поскольку к этим инструкциям часто обращаются (по одному разу за цикл), они, вероятно, не покидают кеш, поэтому другой код (или данные, если кеш унифицирован) должен уйти, что не произошло бы, если бы было меньше обращающихся к нему инструкций, заполняющих кеш записей.