Size: a a a

Церковь метрик

2020 June 04

AS

Aleksey Shirokikh in Церковь метрик
avg(some_value{instance_id="aa"}[1m]) > 1
источник

AV

Aliaksandr Valialkin in Церковь метрик
Aleksey Shirokikh
мы обсуждали с коллегами эту ситуацию они понимают что без ребалансинга это такой себе rf
это такой же replication, как и в m3db :) Его хватает для случаев, когда нужно существенно снизить вероятность утери части данных. В прежней схеме данные просто раскидывались между сторедж нодами. Поэтому при утере данных на одной из сторедж нод эти данные переставали быть видными в последующих запросах (т.е. они терялись). Теперь же все данные остаются видны при утере до RF-1 сторедж нод. Увеличение RF существенно снижает вероятность утери части данных, которая считается по формуле p^RF, где p - вероятность выхода из строя одного стореджа. Например, если вероятность выхода из строя одного стореджа равна 1%, то вероятность утери данных для RF=2 будет равна 0.01^2=0.01%, а для RF=3 она снизится до 0.01^3=0.0001%.

Также репликация позволяет проводить rolling upgrade для vmstorage нод без временной недоступности части данных.
источник

p

ptchol in Церковь метрик
Aleksey Shirokikh
avg(some_value{instance_id="aa"}[1m]) > 1
я не про матч по вхождению полному\частичному а именно сравнение с int значением.
источник

AS

Aleksey Shirokikh in Церковь метрик
Aliaksandr Valialkin
это такой же replication, как и в m3db :) Его хватает для случаев, когда нужно существенно снизить вероятность утери части данных. В прежней схеме данные просто раскидывались между сторедж нодами. Поэтому при утере данных на одной из сторедж нод эти данные переставали быть видными в последующих запросах (т.е. они терялись). Теперь же все данные остаются видны при утере до RF-1 сторедж нод. Увеличение RF существенно снижает вероятность утери части данных, которая считается по формуле p^RF, где p - вероятность выхода из строя одного стореджа. Например, если вероятность выхода из строя одного стореджа равна 1%, то вероятность утери данных для RF=2 будет равна 0.01^2=0.01%, а для RF=3 она снизится до 0.01^3=0.0001%.

Также репликация позволяет проводить rolling upgrade для vmstorage нод без временной недоступности части данных.
источник

AV

Aliaksandr Valialkin in Церковь метрик
оно вроде отключено по умолчанию
источник

AS

Aleksey Shirokikh in Церковь метрик
включено, выключено ни о том речь же
источник

AV

Aliaksandr Valialkin in Церковь метрик
источник

AS

Aleksey Shirokikh in Церковь метрик
аналог да
источник

AS

Aleksey Shirokikh in Церковь метрик
понятно что восстановление или даже увеличение rf это ппц какая дорогая процедура и по cpu и по дискам и по логике
источник

AV

Aliaksandr Valialkin in Церковь метрик
Советую еще почитать там раздел caveats and limitations внизу дока:
* Background repairs do not currently support M3DB's inverted index; as a result, it can only be used for clusters / namespaces where the indexing feature is disabled
* Background repairs will wait until (block start + block size + buffer past) has elapsed before attempting to repair a block. For example, if M3DB is configured with a 2 hour block size and a 20 minute buffer past that M3DB will not attempt to repair the 12PM->2PM block until at least 2:20PM
источник

V

Vovan in Церковь метрик
Aleksey Shirokikh
это два разных механизма.
Это я понял, спасибо! :) Но и в metric_relabel_configs не работает, кроме регулярки (.*)
источник

AS

Aleksey Shirokikh in Церковь метрик
и даже понятно что в мониторинге оно имеет очень не большую ценность
источник

ДУ

Денис Устинов... in Церковь метрик
а https://github.com/go-graphite/gorelka совсем мертвый?
источник

AS

Aleksey Shirokikh in Церковь метрик
Aliaksandr Valialkin
Советую еще почитать там раздел caveats and limitations внизу дока:
* Background repairs do not currently support M3DB's inverted index; as a result, it can only be used for clusters / namespaces where the indexing feature is disabled
* Background repairs will wait until (block start + block size + buffer past) has elapsed before attempting to repair a block. For example, if M3DB is configured with a 2 hour block size and a 20 minute buffer past that M3DB will not attempt to repair the 12PM->2PM block until at least 2:20PM
это я читал и пониимаю ага да. я писал уже в канале что не знаю аналогичной сущности такой как блок в vm поэтому это будет сложнее сделать когда придётся делать
источник

V

Vovan in Церковь метрик
Разобрался, добавив .* в конец регулярки
источник

AS

Aleksey Sviridkin in Церковь метрик
больше года нет коммитов. Либо он идеален, либо в стагнации, чо
источник

AV

Aliaksandr Valialkin in Церковь метрик
Aleksey Shirokikh
нашёл для себя опцию в прометее hashmod. много думал
она нужна для горизонтального масштабирования сркейпинга большого количества таргетов. С помощью нее таргеты можно равномерно разделить на любое количество прометеусов, при этом используя одинаковый конфиг для скрейпинга и меняя в нем только один параметр - значение regex в action: keep после action: hashmod. См. https://www.robustperception.io/scaling-and-federating-prometheus
источник

AS

Aleksey Shirokikh in Церковь метрик
Aliaksandr Valialkin
она нужна для горизонтального масштабирования сркейпинга большого количества таргетов. С помощью нее таргеты можно равномерно разделить на любое количество прометеусов, при этом используя одинаковый конфиг для скрейпинга и меняя в нем только один параметр - значение regex в action: keep после action: hashmod. См. https://www.robustperception.io/scaling-and-federating-prometheus
да да. к сожалению от нее пришлось отказаться
источник

AS

Aleksey Shirokikh in Церковь метрик
хотелось делать хеш по __gcp_project_name
источник

AS

Aleksey Shirokikh in Церковь метрик
но кейс совершенно не складывается ибо не понятно как сказать прометею какие считать рулы для для этого шадра
источник