Все теплейты сообщений у графаны - в коде. Так что единственный способ их поменять - форк нужной версии, поменять код, скомпилить и заменить бинарь на сервере. И делать так при выходе каждой новой версии графаны. Ну и не забывать про AGPL лицензию. Других вариантов - нет
Sla между командами, поддерживающими оба сервиса? Какие-то договорённости о совместных действиях в такой ситуации? Разворачивание командой А аналога сервиса Б под свои цели? Формальное описание процесса эскалации в данном случае?
Командно-административно - эскалируете наверх с описанием проблемы. Не командно-административно - пытаетесь выйти на диалог напрямую и разрулить ситуацию
быть может можно отвечать не 500 а разумным дефолтом и кешем. это не всегда так но возможно так. может быть можно играть в доброго полицейского и разрешать действие которое регулирует встречный сервис. каждый раз когда мы пользуемся такой опцией надо инкрементировать счётчик таких ответов и на него уже вешать sli
Допустим, после воспитатательных мероприятий количество 500 в сервисах-апстримах уменьшается на порядок. Но получается, что команды сервисов-даунстримов все равно страдают от того, что апстримы изредка пятисотит?
я не понимаю в чём неправильность. у вас ведь >Две независимых команды, независимые циклы разработки сервисов, СЛА не заданы и договоренностей о надежности нет.
Хм, интересный вопрос о том, как это сделать 🤔 Сейчас алерт основан на количестве 500 от сервиса в эластике. Мы не знаем, по какой причине этот 500. Выводить в логи дополнительную информацию о том, что ошибка из-за апстрима?