Эта статья представляет собой формализованный ответ на [публикацию на форуме IDZ][1]. Проблема, которую описывал автор исходной публикации, заключалась в том, что производительность работы кода не увеличивалась в достаточной степени при использовании OpenMP на 8-ядерном процессоре E5-2650 V2 с 16 аппаратными потоками. Потребовалось некоторое время на форуме, чтобы помочь автору публикации и предоставить ему необходимые подсказки, однако времени для оптимизации кода было недостаточно. В этой статье описываются дальнейшие методики оптимизации в дополнение к описанным на форуме IDZ. [][2]
[Читать дальше →][3]
[1]:
https://software.intel.com/en-us/forums/intel-moderncode-for-parallel-architectures/topic/590710
[2]:
https://habrahabr.ru/company/intel/blog/301428/
[3]:
https://habrahabr.ru/post/301428/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut