Телеграмм чат группы qa

Такой вопрос: а вот когда вы составляете свои тест сценарии вы задумываетесь о том, сколько уникальных соединений должен будет создавать нагрузочный скрипт?

Ну, 10 запросов в секунду могут идти через одно соединение, могут через 10 разных, а могут вообще

Анонимный опрос

4%

Первый раз слышу о таком

0%

Разве это важно?

17%

Gatling/JMeter/k8/.. само всё делает

40%

В каждом тесте слежу за этим

6%

Пробовали, разницы никакой нет

33%

Нужен доклад от Славы про это

Проголосовало: 52

Viktor Ganeles in QA — Load & Performance

16:12пожаловаться #2

VG

Ну от Славы уже есть доклад про это
Разве не так?

16:13пожаловаться #3

ВС

R2 D2

Всем привет.

Я неофит и я не из опсов - не тестер, не кодер.

https://k6.io/blog/comparing-best-open-source-load-testing-tools взял за основу выбора инструмента. Плюс всё, что выдал стандартный получасовой ресёрч по стековерфлоу.

Собстна, вопрос простой - JMeter vs Tsung. Каков мой оптимальный выбор на старт при учёте того, что энтрипоинт от девелоперов - har-файл и всё? Пока что всё, на что ориентируюсь при выборе - Tsung много производительнее (спасибо Эрлангу за это). Никсы - не проблема (моя специализация), XML для описания - тоже вроде как не проблема (есть трансформ xml2jmx, есть трансформ jmx2tsung). Из потенциально нужного помимо просто http - ws.

Недавно обсуждали инструменты. Там есть интересная статья. В которой одни инструменты побеждают другие по RPS. И ключ победы, как раз, в управлении соединениями (IMHO). Чем менее реальное управление соединениями, тем выше скорость. Тема известная. Ее надо знать, применять. Может удобная кнопка в JMeter нужна для этого. И пару статей с докладом

17:06пожаловаться #4

VS

Недавно обсуждали инструменты. Там есть интересная статья. В которой одни инструменты побеждают другие по RPS. И ключ победы, как раз, в управлении соединениями (IMHO). Чем менее реальное управление соединениями, тем выше скорость. Тема известная. Ее надо знать, применять. Может удобная кнопка в JMeter нужна для этого. И пару статей с докладом

Вот, товарища Вячеслава не проведёшь!
У меня, да, мысль в контексте этой же статьи. Ну и вообще в разрезе постоянных тут обсуждений «сколько потоков ставить».

Ещё бы понять как эта настройка должна удобно регулироваться

17:27пожаловаться #5

ВС

Можно просто галочку добавить, для опции

httpclient.reset_state_on_thread_group_iteration

Со значением по умолчанию false. Куда-нибудь в
https://jmeter.apache.org/usermanual/component_reference.html#HTTP_Request_Defaults

Viktor Ganeles in QA — Load & Performance

17:31пожаловаться #6

VG

Можно просто галочку добавить, для опции

httpclient.reset_state_on_thread_group_iteration

Со значением по умолчанию false. Куда-нибудь в
https://jmeter.apache.org/usermanual/component_reference.html#HTTP_Request_Defaults

+1

17:33пожаловаться #7

VS

org.apache.jmeter.threads.gui.ThreadGroupGui.png

(65.49 Кб)

так есть же галочка в thread group’е

17:33пожаловаться #8

VS

«same user on each iteration»

17:33пожаловаться #9

ВС

Это она и есть? Ничего себе. В описании от Филиппа было про кеш что-то.

17:34пожаловаться #10

ВС

Vladimir Sitnikov

Если её убрать, то на каждой итерации будут чиститься разнообразные кэши (http cookie, http cache, kerberos authentication)

А вот откуда это, не от Филиппа, от тебя, Володя

17:37пожаловаться #11

ВС

Точно, это она и есть:
https://bz.apache.org/bugzilla/show_bug.cgi?id=62861

И её значение сейчас по умолчанию True. То есть JMeter по умолчанию ведёт себя, как ускоренный. Чего раньше не было.

Значит нужна будет статья, почему иногда надо нужно замедлить JMeter. С рассказом об отключении «same user on each iteration»

Mike Kasian in QA — Load & Performance

17:44пожаловаться #12

M

Точно, это она и есть:
https://bz.apache.org/bugzilla/show_bug.cgi?id=62861

И её значение сейчас по умолчанию True. То есть JMeter по умолчанию ведёт себя, как ускоренный. Чего раньше не было.

Значит нужна будет статья, почему иногда надо нужно замедлить JMeter. С рассказом об отключении «same user on each iteration»

Доброго времени суток, Вячеслав не могли бы вы сказать, в каких случаях эту галочку нужно убирать? В кратце, если можно .

18:47пожаловаться #13

ВС

Mike Kasian

Доброго времени суток, Вячеслав не могли бы вы сказать, в каких случаях эту галочку нужно убирать? В кратце, если можно .

Например, есть проблема на продуктиве - зависает веб-сервер (nginx, apache, haproxy), клиенты получают ошибку "503 Сервер не доступен" при высоком количестве запросов (RPS). Мониторинг настроен плохо, поэтому деталей нет. Получаем задачу:

1. Воспроизвести проблему
2. Разобраться в причинах
3. Исправить, предложить рекомендации по устранению

Так как на руках есть профиль нагрузки (запросы и их интенсивность). И ожидаемый результат: 503 в ответ. То пишется тест, пусть в JMeter (новом), wrk, k6, ...

Причина проблемы может быть в следующем.
На продуктиве вот такая конфигурация:
[Клиенты] -> [Балансировщик] -> [nginx/haproxy] -> [app] -> [DB]

Причины по которым некоторые клиенты получают ошибку 503:
1. Зависла [DB], из-за индексов, настроек DB, ... кончились подключения к DB, ошибка по цепочке [DB]->[app]->[nginx/haproxy]... ушла клиенту
2. Завис [app], из-за памяти, логирования, блокировок, ... кончились свободные worker-ы в app, ошибка по цепочке [app]->[nginx/haproxy]... ушла клиенту
3. Завис [nginx/haproxy], из-за лимита соединений (TCP Time Wait), лимита потоков, просто много памяти было выделено так как каждая сессия это память, ошибка по цепочке [nginx/haproxy]->... ушла клиенту

В тесте делается такая конфигурация:
[JMeter] -> [nginx/haproxy] -> [app] -> [DB]

Система тестируется. Скорее всего причина ошибок была (1) или (2). Причина находится, индексы добавляются, утечка памяти чинится, все счастливы.
И такие причины будут выявлены все зависимости от того, сколько соедиенний будет установлено между
[JMeter] -> [nginx/haproxy]
Тут чем меньше соедиенний, тем меньше расходов на их установку и тем выше будет интенсивность отправки запросов. Тем проще будет найти проблемы в [app] и [DB].

Но, если всегда тестировать на малом количестве соединений, то будет сложно найти проблемы в [nginx/haproxy].
Ошибка 503 может быть и не им сформирована. Она может быть из-за того, что проявилась причина (3), завис [nginx/haproxy]. И ошибку отдал [Балансировщик], который не получил ответа от [nginx/haproxy], она есть в логах [Балансировщик], но её нет в логах [nginx/haproxy].

Причина (3) проявится при большом количестве подключений. Чтобы такое большое количество создать, надо будет, чтобы инструмент нагрузки их создавал, чтобы нагрузочных агентов было несколько.

Особенно важно это становится, если проект контентный:
[Клиенты] -> [Балансировщик] -> [nginx/haproxy]
или
[Клиенты] -> [nginx/haproxy]

Mike Kasian in QA — Load & Performance

19:42пожаловаться #14

M

Например, есть проблема на продуктиве - зависает веб-сервер (nginx, apache, haproxy), клиенты получают ошибку "503 Сервер не доступен" при высоком количестве запросов (RPS). Мониторинг настроен плохо, поэтому деталей нет. Получаем задачу:

1. Воспроизвести проблему
2. Разобраться в причинах
3. Исправить, предложить рекомендации по устранению

Так как на руках есть профиль нагрузки (запросы и их интенсивность). И ожидаемый результат: 503 в ответ. То пишется тест, пусть в JMeter (новом), wrk, k6, ...

Причина проблемы может быть в следующем.
На продуктиве вот такая конфигурация:
[Клиенты] -> [Балансировщик] -> [nginx/haproxy] -> [app] -> [DB]

Причины по которым некоторые клиенты получают ошибку 503:
1. Зависла [DB], из-за индексов, настроек DB, ... кончились подключения к DB, ошибка по цепочке [DB]->[app]->[nginx/haproxy]... ушла клиенту
2. Завис [app], из-за памяти, логирования, блокировок, ... кончились свободные worker-ы в app, ошибка по цепочке [app]->[nginx/haproxy]... ушла клиенту
3. Завис [nginx/haproxy], из-за лимита соединений (TCP Time Wait), лимита потоков, просто много памяти было выделено так как каждая сессия это память, ошибка по цепочке [nginx/haproxy]->... ушла клиенту

В тесте делается такая конфигурация:
[JMeter] -> [nginx/haproxy] -> [app] -> [DB]

Система тестируется. Скорее всего причина ошибок была (1) или (2). Причина находится, индексы добавляются, утечка памяти чинится, все счастливы.
И такие причины будут выявлены все зависимости от того, сколько соедиенний будет установлено между
[JMeter] -> [nginx/haproxy]
Тут чем меньше соедиенний, тем меньше расходов на их установку и тем выше будет интенсивность отправки запросов. Тем проще будет найти проблемы в [app] и [DB].

Но, если всегда тестировать на малом количестве соединений, то будет сложно найти проблемы в [nginx/haproxy].
Ошибка 503 может быть и не им сформирована. Она может быть из-за того, что проявилась причина (3), завис [nginx/haproxy]. И ошибку отдал [Балансировщик], который не получил ответа от [nginx/haproxy], она есть в логах [Балансировщик], но её нет в логах [nginx/haproxy].

Причина (3) проявится при большом количестве подключений. Чтобы такое большое количество создать, надо будет, чтобы инструмент нагрузки их создавал, чтобы нагрузочных агентов было несколько.

Особенно важно это становится, если проект контентный:
[Клиенты] -> [Балансировщик] -> [nginx/haproxy]
или
[Клиенты] -> [nginx/haproxy]

Благодарен вам, за развернутый ответ)

19:59пожаловаться #15

ВС

А чтобы обходиться без тестирования можно вести статистику ошибок на [Балансировщик] и [nginx/haproxy], в ELK или кто-то ещё.
Или мониторить соединения, дескрипторы, сокеты, ... на станциях и настраивать систему.

20:09пожаловаться #16

ВС

Другая причина для использования большого количества подключений. Чтобы проверить, что в цепочке
[JMeter] -> [nginx/haproxy] -> [app] -> [DB]
прокси в виде [nginx/haproxy] защищает [app] от большого количества подключений.

Подключение к [app] дорогое - много памяти.
Подключение к [nginx/haproxy] дешевле.

Поэтому и используют [nginx/haproxy], они держат соединения с клиентами, и через пул подключений, ограниченный сверху (пусть в 200), работают с [app]. Так стабильнее.
Для этого надо будет из [JMeter] создать много сессий. Много потоков.

Необходимо такое тестирование вот из-за чего. Бывает в [app] не ограничен пул, или ограничен в 2000 воркеров (много очень). И всё это работает только потому, что перед ним есть [nginx/haproxy], который допускает до [app] только 200 одновременных клиентов, и поэтому в [app] работает только 200 воркеров. И мы не получаем "Out of memory" в [app].

Но если ни [nginx/haproxy] ни [app] не настроены или в них "Для хорошей производительности" все настройки были выставлены в максимум.
А мы в инструменте [JMeter] создаём 10 подключений, вместо 1000, то мы никогда и не нагрузим систему.

Но это уже не очень связано с темой

«same user on each iteration»

Тут даже на сопоставлении 1 поток - 1 соединение можно сделать тысячи соединений, просто выставив в JMeter 1000 потоков.
Это написал для полноты.

Евгений Дульцев... in QA — Load & Performance

20:24пожаловаться #17

ЕД

Всем привет, есть вопрос. Попытался найти в интернете но без результатов, может кто знает как сделать:
Вывод в результаты Jenkins job, где проходит сборка jmeter скрипта нагрузки, ссылки на график из grafana по timestamp?
Ещё круче, если кто-то знает, как можно показать сами графики с помощью какого-нибудь плагина Jenkins или хотя-бы скриншоты графиков из grafana

Mike Kasian in QA — Load & Performance

21:16пожаловаться #18

M

Другая причина для использования большого количества подключений. Чтобы проверить, что в цепочке
[JMeter] -> [nginx/haproxy] -> [app] -> [DB]
прокси в виде [nginx/haproxy] защищает [app] от большого количества подключений.

Подключение к [app] дорогое - много памяти.
Подключение к [nginx/haproxy] дешевле.

Поэтому и используют [nginx/haproxy], они держат соединения с клиентами, и через пул подключений, ограниченный сверху (пусть в 200), работают с [app]. Так стабильнее.
Для этого надо будет из [JMeter] создать много сессий. Много потоков.

Необходимо такое тестирование вот из-за чего. Бывает в [app] не ограничен пул, или ограничен в 2000 воркеров (много очень). И всё это работает только потому, что перед ним есть [nginx/haproxy], который допускает до [app] только 200 одновременных клиентов, и поэтому в [app] работает только 200 воркеров. И мы не получаем "Out of memory" в [app].

Но если ни [nginx/haproxy] ни [app] не настроены или в них "Для хорошей производительности" все настройки были выставлены в максимум.
А мы в инструменте [JMeter] создаём 10 подключений, вместо 1000, то мы никогда и не нагрузим систему.

Но это уже не очень связано с темой

«same user on each iteration»

Тут даже на сопоставлении 1 поток - 1 соединение можно сделать тысячи соединений, просто выставив в JMeter 1000 потоков.
Это написал для полноты.

Ещё раз, благодарю.

Kirill Borovko in QA — Load & Performance

21:23пожаловаться #19

2020 March 26

KB

Евгений Дульцев

Всем привет, есть вопрос. Попытался найти в интернете но без результатов, может кто знает как сделать:
Вывод в результаты Jenkins job, где проходит сборка jmeter скрипта нагрузки, ссылки на график из grafana по timestamp?
Ещё круче, если кто-то знает, как можно показать сами графики с помощью какого-нибудь плагина Jenkins или хотя-бы скриншоты графиков из grafana

Если я правильно понял вопрос, то в дженкинсе можно после окончания нагрузочного теста опубликовать автосгенереный отчёт jmeter