[#] [Из песочницы] Как pdf (изображения) преобразовать в текстовый txt-файл
habrabot(difrex,1) — All
2016-11-02 19:30:03


Вы скажете, что самый простой способ — выделить весь текст в pdf, скопировать его в буфер обмена и вставить из буфера обмена в текстовый файл. И будете правы. Но это не наш случай. Файл pdf — результат сканирования многостраничного документа. Т.е. содержимое pdf — это изображения текста.

![image][1]

Предлагаемый вариант решения реализован под Windows-8, но с небольшими корректировками, думаю, вполне может быть использован для Linux и OS X.
[Читать дальше →][2]

[1]: https://habrastorage.org/getpro/habr/post_images/5a4/0a6/7e9/5a40a67e9e23f4c72a3e533bee4a6e81.jpg
[2]: https://habrahabr.ru/post/314274/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut