Хочу поделиться опытом решения задачи по машинному обучению и анализу данных от Kaggle. Данная статья позиционируется как руководство для начинающих пользователей на примере не совсем простой задачи.
**Выборка данных**
Выборка данных содержит порядка 8,5 млн строк и 29 столбцов.Вот некоторые из параметров:
* Широта-latitude
* Долгота-longitude
* Способ взятия пробы-method\_name
* Дата и время взятия пробы-date\_local
![image][1]
**Задача**
1. Найти параметры максимально влияющие на уровень CO в атмосфере.
2. Создание гипотезы, предсказывающей уровень CO в атмосфере.
3. Создание нескольких простых визуализаций. [Читать дальше →][2]
[1]:
https://habrastorage.org/webt/fh/5q/4b/fh5q4bzkezrxwg75ne0oyq47-ui.png
[2]:
https://habrahabr.ru/post/341130/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut