До:
![][1]
После:
![][2]
Заинтригованы? Но обо всем по порядку.
[t-SNE][3] — это очень популярный алгоритм, который позволяет снижать размерность ваших данных, чтобы их было проще визуализировать. Этот алгоритм может свернуть сотни измерений к всего двум, сохраняя при этом важные отношения между данными: чем ближе объекты располагаются в исходном пространстве, тем меньше расстояние между этими объектами в пространстве сокращенной размерности. t-SNE неплохо работает на маленьких и средних реальных наборах данных и не требует большого количества настроек гиперпараметров. Другими словами, если взять 100 000 точек и пропустить их через эту волшебный черный ящик, на выходе мы получим красивый график рассеяния.
[Читать дальше →][4]
[1]:
https://habrastorage.org/files/14b/047/01f/14b04701f5234739baf7c70b58f70921.png
[2]:
https://habrastorage.org/files/0d8/21e/8bc/0d821e8bc2fe47c6897a7c3fa1b44c8a.png
[3]:
https://lvdmaaten.github.io/tsne/
[4]:
https://habrahabr.ru/post/326750/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut