Среди большого количества [цикловых оптимизаций][1], одной из наиболее эффективных является техника разделения цикла на блоки (loop blocking). Суть её заключается в изменении итерационного пространства с целью более оптимальной работы с памятью, то есть уменьшения промахов кэша. Для этих целей в последней версии компилятора появилась специальная директива, позволяющая контролировать эту оптимизацию. Но обо всём по порядку. [Читать дальше →][2]
[1]:
http://habrahabr.ru/post/124910/
[2]:
http://habrahabr.ru/post/265095/#habracut