Size: a a a

Церковь метрик

2020 July 13

AS

Aleksey Shirokikh in Церковь метрик
ну и скорость выборки довольно большая
источник
2020 July 14

ST

Sergey Trapeznikov in Церковь метрик
Sergey Trapeznikov
А есть какие то особые правила для https эндпоинтов блекбокса?
Например есть экспортер в другом регионе, который мониторит доступность хостов внутри региона. Задумывалось его опрашивание через https nginx через локейшен с вайтлистом.
Проблема в реплейсинге адреса с дефолтного 127.0.0.1:9115/probe на site.com/blackbox_metrics. Если я использую реплейсинг на http://site.com/blackbox_exporter то я не могу собирать метрики по таргетам экспортера.
А если я ставлю реплейсинг на https://site.com/blackbox_metrics то джоба становится ок, но сам таргет пропадает О _о.
  - job_name: 'blackbox_china'
   metrics_path: /blackbox_metrics
   static_configs:
     - targets:
       - https://somesite.com   # Target to probe with https.
   relabel_configs:
     - source_labels: [__address__]
       target_label: __param_target
     - source_labels: [__param_target]
       target_label: instance
     - target_label: __address__
       replacement: http://site.com


> err="instance 0 in group 0: \"https://site.com\" is not a valid hostname
я неправильно понимаю ямл формат реплейса или почему не могу мониторить отличный от 127.0.0.1:9115? В чем моя ошибка?
Гуглеж на тему "scrape multiple blackbox" не навел на решение или примеры
источник

ДУ

Денис Устинов... in Церковь метрик
Посмотри примеры. У тебя даже metric_path неверный
источник

ST

Sergey Trapeznikov in Церковь метрик
а кто подскажет куда делся данный функционал из visualization table?
источник

ST

Sergey Trapeznikov in Церковь метрик
Денис Устинов
Посмотри примеры. У тебя даже metric_path неверный
нет, в том и суть что там не /probe а кастомный локейшен, я через него хочу скрейпить
источник

ST

Sergey Trapeznikov in Церковь метрик
то есть я выставил блекбокс за nginx location proxy_pass: 127.0.0.1:9115
имя локейшена это metric_path
источник

ST

Sergey Trapeznikov in Церковь метрик
но пром отказывается применять реплейсмент адреса на инстанс для формата site.com
источник

SM

Sergey Monakhov in Церковь метрик
>err="instance 0 in group 0: \"https://site.com\" is not a valid hostname
hostname не может быть с https://
источник

ST

Sergey Trapeznikov in Церковь метрик
Sergey Monakhov
>err="instance 0 in group 0: \"https://site.com\" is not a valid hostname
hostname не может быть с https://
он и с http не читает
источник

ST

Sergey Trapeznikov in Церковь метрик
ему само имя хоста не нравится
источник

SM

Sergey Monakhov in Церковь метрик
оставь просто site.com
источник

SM

Sergey Monakhov in Церковь метрик
и понравится
источник

ST

Sergey Trapeznikov in Церковь метрик
Sergey Trapeznikov
а кто подскажет куда делся данный функционал из visualization table?
тут вообще нет старых полей для построения колонок
источник

G

GithubReleases in Церковь метрик
ClickHouse/ClickHouse tagged: v20.4.7.67-stable
Link: https://github.com/ClickHouse/ClickHouse/releases/tag/v20.4.7.67-stable
Release notes:
v20.4.7.67-stable
источник

AV

Aliaksandr Valialkin in Церковь метрик
Dmitry S.
Чтобы influx не захлёбывлался от большого количества метрик и была возможность мониторить это состояние, на какие метрики стоит обратить внимание? Использую inputs.influxdb, да.
самое правильное решение - использовать victoriametrics вместо influx :) См. https://medium.com/@valyala/insert-benchmarks-with-inch-influxdb-vs-victoriametrics-e31a41ae2893
источник

DS

Dmitry S. in Церковь метрик
Aliaksandr Valialkin
самое правильное решение - использовать victoriametrics вместо influx :) См. https://medium.com/@valyala/insert-benchmarks-with-inch-influxdb-vs-victoriametrics-e31a41ae2893
спасибо, ознакомлюсь
источник

E

Eugene in Церковь метрик
Dmitry S.
Чтобы influx не захлёбывлался от большого количества метрик и была возможность мониторить это состояние, на какие метрики стоит обратить внимание? Использую inputs.influxdb, да.
SELECT max("memBytes") FROM "influxdb_tsm1_cache" WHERE $timeFilter GROUP BY time($group_time), "database", "host" fill(null) - размер кешей, если улетают в полку, то инфлакс не успевает мерижить кэши и писать на диск. В норме должно быть в районе snapshot-memory-size, но может быть выше. Если держится на постоянном уровне - хорошо. Растёт(в течении более 6 часов) - плохо.

SELECT last("numFiles") FROM "influxdb_tsm1_filestore" WHERE $timeFilter GROUP BY time($group_time), "database" fill(null) - количество открытых файлов на базу, если открыто слишком много, то очень быстро закончится память и будет oom. Слишком много - это больше 100. При 1000 200ГБ+ ОЗУ может не хватить

SELECT last("numSeries") FROM "influxdb_database" WHERE $timeFilter GROUP BY time($group_time), "database" fill(null) - количество серий на базу. Если много больше 100к, то надо смотреть кто пишет. Метрику лучше смотреть за месяц. Очень наглядно показывает где проблемы.

SELECT difference(last("seriesCreate")) FROM "influxdb_shard" WHERE $timeFilter GROUP BY time($group_time), "database" fill(null) - метрика показывающая изменение серий на бд. В том же межменте есть fieldsCreate, показывает когда создаются новые филды

Но Александр прав, если только запускаетесь и стоит выбор базы, то Виктория лучше подойдёт. Если нужены "много баз", то в кластерной виктории есть тенанты, что примерно одно и тоже.
источник

AN

Artem Navoiev in Церковь метрик
у кого есть стандартный запрос который покажет процент потребления памяти пода в кубере от его лимита? (prom)
источник

k

krakazyabra in Церковь метрик
Наконец-то запилили новый мониторинг!
источник

AV

Aliaksandr Valialkin in Церковь метрик
krakazyabra
Наконец-то запилили новый мониторинг!
Интуитивно понятный интерфейс! Намного лучше графаны
источник