В церкви метрик пишут следующее:
https://github.com/freeseacher/metrics_ru_faq#про-influxdbИз неприятных особенностей InfluxDB заметил отказ писать данные из-за отсутствия места, даже если это место снова освободилось. Помогает рестарт сервиса.
На одном проекте заказчик мониторит Prometheus'ом, на другом - Zabbix'ом. На втором нас к имеющемуся мониторингу пока не допустили, потому поднял промы на машинах с джметром и заглушками. Уже было так, что диски забивались, в этом случае запись метрик в InfluxDB прекратилась бы. Зачем 2 прома? Сначала был только на машине с джметром, но иногда при подаче нагрузки дашборд показывает пустоту. Грешу на диски (машины уже сбоили из-за них), потому поднял резервный. Конечно, с самого начала нужно было выбить машину для мониторинга, но пришлось использовать то, что есть.