Ок, тогда, обычно, делается ступенчатый тест на поиск максимума, я на пристрелке увеличивал нагрузку примерно на 20% за ступень, ступени по 20-30 минут, чтобы сгладить какие-то пики и получить репрезентативные данные. Уровнем максимальной производительности считается уровень нагрузки, предшествующий ступени, где показатели выходят за рамки бизнесовых или аппаратных SLA.
Теперь у нас есть условные 100% - наша максимальная производительность. От этих 100 берем 80 - это будет наш уровень нагрузки для теста стабильности. Его имеет смысл проводить от 4 часов(имхо), можно 8-12-24, в зависимости от ресурсов и целей. Допустим, если есть деградация, то есть смысл тестировать до тех пор, пока она не превысит разумные границы