[#] Анализ OpenMP регионов с Intel® VTune™ Amplifier XE
habrabot(difrex,1) — All
2015-02-09 13:00:02


OpenMP\* — довольно популярная модель параллельного программирования, особенно для высокопроизводительных вычислений. Но чтобы этой высокой производительности достичь, OpenMP конструкции частенько приходится «настраивать». И здесь не обойтись без хорошего профилировщика. Большинство профилировщиков выдают данные о производительности, ассоциированные с функциями или циклами, но не дают картины по конкретным OpenMP регионам. В результате программист теряет контекст. А без OpenMP-контекста диагностика дисбалансов или накладных расходов становится весьма затруднительной. Intel® VTune™ Amplifier XE [умеет профилировать OpenMP регионы][1]. Свежая версия 2015 Update 2 делает анализ гораздо более простым и понятным, благодаря представлению данных в «OpenMP терминах». Инструмент показывает время параллельных и последовательных регионов, разницу между фактическим и идеализированным временем исполнения региона, разбивку по параллельным циклам и загрузку ЦПУ по каждому региону в отдельности. Пользователь может легче понять, куда вкладывать усилия в первую очередь, благодаря метрике «potential gain». Классификация накладных расходов помогает определить причину неэффективности – например, ожидание из-за дисбаланса нагрузки или на «замке» из-за синхронизации. Статья описывает некоторые типы OpenMP проблем, определяемых VTune Amplifier, как их нужно понимать и устранять. ![][2] [Читать дальше →][3]

[1]: http://habrahabr.ru/company/intel/blog/204058/
[2]: //habrastorage.org/files/64d/cca/f23/64dccaf23be147c6aa68b92e35dbdf48.png
[3]: http://habrahabr.ru/post/248979/#habracut