![][1]
> Работу каждой программы можно ускорить минимум в десять раз
>
>
>
>
>
> Рабочая установка разработчиков Smart Engines
>
>
Мы расскажем о нескольких приемах ускорения распознавания с помощью OCR Tesseract. Всё рассказанное было использовано в реализации проекта, смысл которого состоял в классификации большого числа образов страниц деловых документов (таких документов как паспорт, договор, контракт, доверенность, свидетельство о регистрации и т.п.) и сохранении результатов в электронном архиве. Часть алгоритмов классификации была основана на анализе собственно образов страниц, а часть – на анализе извлечённых из образа текстов. Для извлечения текстов было необходимо распознавание с помощью OCR.
[Читать дальше →][2]
[1]:
https://habrastorage.org/files/2d5/712/d31/2d5712d314e9436e991f13d4cc3cfabe.png
[2]:
https://habrahabr.ru/post/300990/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut