Есть мнение, что система электронного документооборота полностью избавляет от работы с бумагами, но это не так. Для оцифровки бумажных экземпляров документов их обычно пропускают через сканер. Когда поток документов и требования к качеству сканов превышают некоторый порог возникает ряд вопросов, которые необходимо решать программно. Какие проблемы приходится решать:
* Корректировать угол наклона изображения, т.к. фидер сканера неизбежно наклоняет документ при протяжке. Неряшливость в важных документах недопустима.
* Выделять полезную часть на скане, остальное — удалять, так как это не информативно и занимает дисковое пространство впустую.
* Находить и удалять пустые страницы, которые обязательно будут при дуплекс-сканировании.
[Читать дальше →][1]
[1]:
https://habrahabr.ru/post/278073/#habracut