habra.16 / [Перевод] 96 вычислительных ядер и оптимизация кода муравьиного алгоритма поиска маршрутов

Сегодня поговорим об оптимизации кода, который реализует муравьиный алгоритм нахождения оптимальных путей на графах. Узкие места в программе будем искать с помощью [Intel VTune Amplifier XE][1] 2016 Update 2, а оптимизировать с использованием [MPI][2], OpenMP и библиотеки Intel Threading Building Blocks.

![][3]

Наша цель заключается в том, чтобы добиться эффективной работы программы на компьютере с четырьмя процессорами [Intel Xeon E7-8890 v4][4]. Система оснащена 512 Гб оперативной памяти, на ней установлена Linux 3.10.0-327.el7.x86\_64, код компилировался с помощью Intel Parallel Studio XE 2016 U2.
[Читать дальше →][5]

[1]: https://software.intel.com/en-us/intel-vtune-amplifier-xe
[2]: https://computing.llnl.gov/tutorials/mpi/
[3]: https://habrastorage.org/getpro/habr/post_images/dc9/43b/6d1/dc943b6d1065e4fba0ead458ae3aa156.jpg
[4]: http://www.intel.com/content/www/us/en/processors/xeon/xeon-processor-e7-family.html
[5]: https://habrahabr.ru/post/311618/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut