[#] [Перевод] Волшебное введение в алгоритмы классификации
habrabot(difrex,1) — All
2017-06-22 12:30:05


_Перевод [статьи ][1]Брайна Беренда._

Когда вы впервые приступаете к изучению теории анализа и обработки данных, то одними из первых вы изучаете алгоритмы классификации. Их суть проста: берётся информация о конкретном результате наблюдений (data point), на основании которой этот результат относится к определённой группе или классу.

Хороший пример — спам-фильтр электронной почты. Он должен помечать входящие письма (то есть результаты наблюдений) как «спам» или «не спам», ориентируясь на информацию о письмах (отправитель, количество слов, начинающихся с прописных букв, и так далее).

![][2]

Это пример хороший, но скучный. Спам-классификацию приводят в качестве примера на лекциях, презентациях и конференциях, так что вы наверняка уже не раз слышали о нём. Но что если поговорить о другом, более интересном алгоритме классификации? Каком-то более странном? Более… волшебном?


Всё верно! Сегодня мы поговорим о Распределяющей шляпе (Sorting Hat) из мира Гарри Поттера. Возьмём какие-то данные из сети, проанализируем и создадим классификатор, который будет сортировать персонажей по разным факультетам. Должно получиться забавно!
[Читать дальше →][3]

[1]: http://blog.yhat.com/posts/harry-potter-classification.html
[2]: https://habrastorage.org/web/420/b08/cd7/420b08cd728844a3863b0f7ae19b9ec0.png
[3]: https://habrahabr.ru/post/331352/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut