[#] [Из песочницы] Как pdf преобразовать в текстовый txt-файл
habrabot(difrex,1) — All
2016-11-02 17:00:03


Вы скажете, что самый простой способ — выделить весь текст в pdf, скопировать его в буфер обмена и вставить из буфера обмена в текстовый файл. И будете правы. Но это не наш случай. Файл pdf — результат сканирования многостраничного документа. Т.е. содержимое pdf — это изображения текста.

![image][1]

Предлагаемый вариант решения реализован под Windows-8, но с небольшими корректировками, думаю, вполне может быть использован для Linux и OS X.
[Читать дальше →][2]

[1]: http://www.enolsoft.com/blog/wp-content/uploads/2014/03/ocr-system-diagram.jpg
[2]: https://habrahabr.ru/post/314274/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut