В предыдущем [посте ][1] я постарался описать, как легко можно воспользоваться преимуществом GPU для обработки изображений. Судьба сложилась так, что мне подвернулась возможность попробовать улучшить медианную фильтрацию для GPU. В данном посте я постараюсь рассказать каким образом можно получить еще больше производительности от GPU в обработке изображений, в частности, на примере медианной фильтрации. Сравнивать будем GPU GTX 780 ti с [оптимизированным кодом][2], запущенном на современном процессоре Intel Core i7 Skylake 4.0 GHz с набором векторных регистров AVX2. Достигнутая скорость фильтрации квадратом 3х3 в 51 GPixels/sec для GPU GTX 780Ti и удельная скорость фильтрации квадратом 3х3 в 10.2 GPixels/sec на 1 TFlops для одинарной точности на данное время являются самыми высокими из всех известных в мире.
[Интересуешься оптимизациями для GPU Nvidia? - читать далее][3]
[1]:
https://habrahabr.ru/post/305964/
[2]:
https://sourceforge.net/projects/simd/
[3]:
https://habrahabr.ru/post/308214/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut