S
тогда смотрите
обычно я персентили не считаю
обычно я делю latency на несколько бакетов и задаю этим бакетам границы исходя из требования к сервису
а дальше рисую stacked диаграмму по кол-ву запросов в каждом бакете за единицу времени
и зеленым\синим отображаю "безопасные" бакеты, а "желтым" и "красным" - "опасные"
обычно значения 0-0.2sec, 0.2-0.5sec, 0.5-2sec, 2+sec
но для ваших сервисов требования могут быть другие