[#] Быстрее быстрого или глубокая оптимизация Медианной фильтрации для GPU Nvidia
habrabot(difrex,1) — All
2016-08-23 12:30:04


# Введение



В предыдущем [посте ][1] я постарался описать, как легко можно воспользоваться преимуществом GPU для обработки изображений. Судьба сложилась так, что мне подвернулась возможность попробовать улучшить медианную фильтрацию для GPU. В данном посте я постараюсь рассказать каким образом можно получить еще больше производительности от GPU в обработке изображений, в частности, на примере медианной фильтрации. Сравнивать будем GPU GTX 780 ti с [оптимизированным кодом][2], запущенном на современном процессоре Intel Core i7 Skylake 4.0 GHz с набором векторных регистров AVX2. Достигнутая скорость фильтрации квадратом 3х3 в 51 GPixels/sec для GPU GTX 780Ti и удельная скорость фильтрации квадратом 3х3 в 10.2 GPixels/sec на 1 TFlops для одинарной точности на данное время являются самыми высокими из всех известных в мире.

[Интересуешься оптимизациями для GPU Nvidia? - читать далее][3]

[1]: https://habrahabr.ru/post/305964/
[2]: https://sourceforge.net/projects/simd/
[3]: https://habrahabr.ru/post/308214/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut