Я продолжаю подробно рассказывать о приемах оптимизации, позволивших мне написать самый быстрый ресайз изображений на современных x86 процессорах. На этот раз речь пойдет о преобразовании вычислений с плавающей точкой в вычисления с целыми числами. Сперва я расскажу немного теории, как это работает. Затем вернусь к реальному коду, в том числе SIMD-версии.
В предыдущих частях:
→ [Часть 0][1]
→ [Часть 1, общие оптимизации][2]
→ [Часть 2, SIMD][3]
[Читать дальше →][4]
[1]:
https://habrahabr.ru/post/321744/
[2]:
https://habrahabr.ru/post/322352/
[3]:
https://habrahabr.ru/post/326900/
[4]:
https://habrahabr.ru/post/334790/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut