Если вы интересуетесь искусственным интеллектом и прочим распознаванием, то наверняка уже видели эту картинку: ![][1] _А если не видели, то это результаты Хинтона и Крижевского по классификации ImageNet-2010 глубокой сверточной сетью_ Давайте взглянем на ее правый угол, где алгоритм опознал леопарда с достаточной уверенностью, разместив с большим отрывом на втором и третьем месте ягуара и гепарда. Это вообще довольно любопытный результат, если задуматься. Потому что… скажем, _вы_ знаете, как отличить одного большого пятнистого котика от другого большого пятнистого котика? Я, например, нет. Наверняка есть какие-то зоологические, достаточно тонкие различия, типа общей стройности/массивности и пропорций тела, но мы же все-таки говорим о компьютерном алгоритме, которые до сих пор допускают какие-то [вот такие][2] достаточно глупые с человеческой точки зрения ошибки. Как он это делает, черт возьми? Может, тут что-то связанное с контекстом и фоном (леопарда вероятнее обнаружить на дереве или в кустах, а гепарда в саванне)? В общем, когда я впервые задумался над конкретно этим результатом, мне показалось, что это очень круто и мощно, разумные машины где-то за углом и поджидают нас, да здравствует deep learning и все такое. Так вот, на самом деле все совершенно не так. [под катом пятна][3]
[1]:
https://habrastorage.org/files/262/417/fc6/262417fc6b5d4ec3b56f8be2d6108c9b.png
[2]:
http://weknowmemes.com/wp-content/uploads/2013/03/facial-recognition-fail.jpg
[3]:
http://habrahabr.ru/post/259191/#habracut