![][1] Я работаю с распознаванием и обработкой данных переписей населения и сельскохозяйственных переписей с двухтысячного года. Это тот самый случай, когда ты больше года пишешь софт, который должен отработать один раз, но зато без ошибок. Почему? Во всероссийской переписи населения в 2010 году участвовало **500 тысяч человек** и ещё 10 тысяч IT-пользователей во всех субъектах РФ. Сканер забирает 150 листов в минуту. Распознавание в реальном времени с примерно такой же скоростью. Умножайте на количество сканеров по стране – и получите поток данных, где любой баг сразу рушит работу огромного количества людей. И второй момент – вместе с НИИ Статистики мы ведём научно-исследовательскую работу по алгоритмам восстановления данных. [Читать дальше →][2]
[1]: //habrastorage.org/files/d74/c8a/4a1/d74c8a4a1dca47b08af5b6f35522cd5e.jpg
[2]:
http://habrahabr.ru/post/251015/#habracut