[#] [ScanDoc] предобработка сканов
habrabot(difrex,1) — All
2016-02-29 13:30:03






Есть мнение, что система электронного документооборота полностью избавляет от работы с бумагами, но это не так. Для оцифровки бумажных экземпляров документов их обычно пропускают через сканер. Когда поток документов и требования к качеству сканов превышают некоторый порог возникает ряд вопросов, которые необходимо решать программно. Какие проблемы приходится решать:

* Корректировать угол наклона изображения, т.к. фидер сканера неизбежно наклоняет документ при протяжке. Неряшливость в важных документах недопустима.
* Выделять полезную часть на скане, остальное — удалять, так как это не информативно и занимает дисковое пространство впустую.
* Находить и удалять пустые страницы, которые обязательно будут при дуплекс-сканировании.

[Читать дальше →][1]

[1]: https://habrahabr.ru/post/278073/#habracut