![][1] Сейчас существует достаточно много систем для хранения и обработки метрик (timeseries db), но ситуация с агентами (софтом, который собирает метрики) сложнее. Не так давно появился [telegraf][2], но все равно выбор не велик.
При этом практически все облачные сервисы мониторинга разрабатывают свои агенты и [мы][3] не исключение. Мотивация достаточно простая — есть много специфичных требований, которые слабо вписываются в архитектуру существующих решений.
Основные наши специфичные требования:
* надежность доставки метрик в облако
* непростая логика плагинов: они взаимодействуют друг с другом
* диагностика: мы должны уметь понимать, почему агент не может собрать те или иные метрики
* агент должен потреблять как можно меньше ресурсов клиентского сервера
Под катом расскажу несколько аспектов разработки агента для сбора метрик.
[Читать дальше →][4]
[1]:
https://habrastorage.org/files/ca8/c4d/6df/ca8c4d6df3324fa8a2fd41749dc059bf.jpg
[2]:
https://github.com/influxdata/telegraf
[3]:
https://okmeter.io
[4]:
https://habrahabr.ru/post/312560/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut