Телеграмм чат группы qa

Для больших данных и обработки данных с диска есть решение в виде ClickHouse. Он сжимает данные, хорошо читает с диска за счёт колоночной структуры. Поэтому быстр. Но на нём надо будет научиться программировать, у него специфичные функции. С ним можно логи долго не удалять и хранить подробную историю всего. Ещё не пробовал в бою, просто присматриваюсь.

Pandas хорош для вычислений в оперативной памяти, он загружает весь DataFrame в ОЗУ. Ему надо много ОЗУ, работает он быстро. Пробовал в бою. Если данные в ОЗУ не поместятся, то включится gc, обработка замедлится или вообще будет не возможна. На практике во время загрузки данных выполнялся их парсинг, чтобы сырые данные превратить в статистику, которая влежает в ОЗУ.

ElasticSearch не сжимает данные, имеет быстрый и удобный поисковый движок, но требует много места на диске под индексы. Поэтому там логи больше недели не хранят. Он для оперативного разбора данных за последнюю неделю.

InfluxDB хорош для хранения статистики, а не для сырых данных. В него загружаю статистику по логам - сколько было таких текстов (тегов) за 5 минут. А не все тексты за 5 минут. Статистику можно создать в awk, python + pandas, csvkit, чем-либо другом. Такой объем он переваривает легко. Если залить в InfluxDB сырые данные, то база зависнет. Он может хранить данные по году и больше, если туда всё подряд не лить

источник

19:53пожаловаться #5

VG

Viktor Ganeles in QA — Load & Performance

да, бд инфлакса я уже вешал :)
значит стоит подумать в сторону эластика, наверное. Потому что мне логи анализировать интересно в ближайшее время после теста - что бы понять, что и как померло.

источник

19:56пожаловаться #6

KY

Kirill Yurkov in QA — Load & Performance

а чем плохо решение, когда при фейле семпла пишется респонс в инфлюкс через хттп, ему можно добавить айди закуска и семпл в котором был фейл. БД не распухает - я поставил жизнь на эту таблицу 2 недели, потом удаляется. проанализрвал с удобствами и все

источник

20:19пожаловаться #7

ВС

Вячеслав Смирнов... in QA — Load & Performance

Kirill Yurkov

а чем плохо решение, когда при фейле семпла пишется респонс в инфлюкс через хттп, ему можно добавить айди закуска и семпл в котором был фейл. БД не распухает - я поставил жизнь на эту таблицу 2 недели, потом удаляется. проанализрвал с удобствами и все

Здорово

источник

20:24пожаловаться #8

KY

Kirill Yurkov in QA — Load & Performance

а логи приложений в ELK храним, в целом - довольно удобно

источник

20:28пожаловаться #9

S

Solresl in QA — Load & Performance

ELK хорош если нужен полнотекстовой поиск, из ещë плюсов есть kibana как gui.

В кх синтаксис sql запросов, что может быть проще чем кибана или lucene в elk.
В кх можно ttl также выставлять для данных чтобы ротировать.
Gui специфичные, но есть. Мы пишем в кх syslog-ом, а отображаем графаной.

источник

20:35пожаловаться #10

KY

Kirill Yurkov in QA — Load & Performance

Solresl

ELK хорош если нужен полнотекстовой поиск, из ещë плюсов есть kibana как gui.

В кх синтаксис sql запросов, что может быть проще чем кибана или lucene в elk.
В кх можно ttl также выставлять для данных чтобы ротировать.
Gui специфичные, но есть. Мы пишем в кх syslog-ом, а отображаем графаной.

я смотрю тоже в сторону кх, но пока текущий стек не дает поводов попробовать

источник

21:10пожаловаться #11

S

Solresl in QA — Load & Performance

Если он устраивает, то и менять не стоит. ELK На малых объемах удобнее, на больших просто прожорливее.

источник

21:11пожаловаться #12

2020 June 08

I

I-1 in QA — Load & Performance

Viktor Ganeles

Кстати, есть удобные способы анализировать ошибки, проявившиеся в ходе теста Jmeter?
Что есть: в Grafana вижу, что завалились 15% операций.
А причины - не вижу. То, что Jmeter передаёт через backendListner - бесполезная фигня.
Можно анализировать лог жметра, но если нам нужны ответы с сообщениями об ошибках - лог должен быть в xml, а вы знаете, как это классно - читать xml на пару мегабайт.

у Серпутко есть jsr223-листнер, который, вроде, умеет передавать в influx сами ошибки, но он требует установленной галочки "Create parent sempler", а с ней увеличивается расход памяти. Но я уже думаю перейти на этот вариант.

Чего хочется:
Что бы к логи тоже складывались в хранилище, откуда можно было читать информацию в Grafana, фильтруя по $TimeFilter или тредгруппам / транзакциям.

Вроде напрашивается передача логов в Elastic или парсинг их и передача в графану.

Но может уже есть готовые решения, что бы не пилить свои велосипеды?

Способ есть)

источник

00:36пожаловаться #13

I

I-1 in QA — Load & Performance

Viktor Ganeles

Кстати, есть удобные способы анализировать ошибки, проявившиеся в ходе теста Jmeter?
Что есть: в Grafana вижу, что завалились 15% операций.
А причины - не вижу. То, что Jmeter передаёт через backendListner - бесполезная фигня.
Можно анализировать лог жметра, но если нам нужны ответы с сообщениями об ошибках - лог должен быть в xml, а вы знаете, как это классно - читать xml на пару мегабайт.

у Серпутко есть jsr223-листнер, который, вроде, умеет передавать в influx сами ошибки, но он требует установленной галочки "Create parent sempler", а с ней увеличивается расход памяти. Но я уже думаю перейти на этот вариант.

Чего хочется:
Что бы к логи тоже складывались в хранилище, откуда можно было читать информацию в Grafana, фильтруя по $TimeFilter или тредгруппам / транзакциям.

Вроде напрашивается передача логов в Elastic или парсинг их и передача в графану.

Но может уже есть готовые решения, что бы не пилить свои велосипеды?

Вот жеж он)

источник

00:39пожаловаться #14

I

I-1 in QA — Load & Performance

Viktor Ganeles

Кстати, есть удобные способы анализировать ошибки, проявившиеся в ходе теста Jmeter?
Что есть: в Grafana вижу, что завалились 15% операций.
А причины - не вижу. То, что Jmeter передаёт через backendListner - бесполезная фигня.
Можно анализировать лог жметра, но если нам нужны ответы с сообщениями об ошибках - лог должен быть в xml, а вы знаете, как это классно - читать xml на пару мегабайт.

у Серпутко есть jsr223-листнер, который, вроде, умеет передавать в influx сами ошибки, но он требует установленной галочки "Create parent sempler", а с ней увеличивается расход памяти. Но я уже думаю перейти на этот вариант.

Чего хочется:
Что бы к логи тоже складывались в хранилище, откуда можно было читать информацию в Grafana, фильтруя по $TimeFilter или тредгруппам / транзакциям.

Вроде напрашивается передача логов в Elastic или парсинг их и передача в графану.

Но может уже есть готовые решения, что бы не пилить свои велосипеды?

image_2020-05-25_19-39-58.png

(38.76 Кб)

источник

00:39пожаловаться #15

I

I-1 in QA — Load & Performance

Viktor Ganeles

Кстати, есть удобные способы анализировать ошибки, проявившиеся в ходе теста Jmeter?
Что есть: в Grafana вижу, что завалились 15% операций.
А причины - не вижу. То, что Jmeter передаёт через backendListner - бесполезная фигня.
Можно анализировать лог жметра, но если нам нужны ответы с сообщениями об ошибках - лог должен быть в xml, а вы знаете, как это классно - читать xml на пару мегабайт.

у Серпутко есть jsr223-листнер, который, вроде, умеет передавать в influx сами ошибки, но он требует установленной галочки "Create parent sempler", а с ней увеличивается расход памяти. Но я уже думаю перейти на этот вариант.

Чего хочется:
Что бы к логи тоже складывались в хранилище, откуда можно было читать информацию в Grafana, фильтруя по $TimeFilter или тредгруппам / транзакциям.

Вроде напрашивается передача логов в Elastic или парсинг их и передача в графану.

Но может уже есть готовые решения, что бы не пилить свои велосипеды?

image_2020-05-25_19-44-59.png

(72.01 Кб)

источник

00:39пожаловаться #16

I

I-1 in QA — Load & Performance

Ну и сорт еще раз в конце)

источник

00:39пожаловаться #17

I

I-1 in QA — Load & Performance

Тут получаем топ ошибок с их причинами.
Обработка файла xml логов лисенера, достаточно errors only.

Данные примеры не слишком показательны, потому что там текст ошибки был в теле ответа, а response code всегда 200.
Обычно код не 200, и в response message всё-таки есть информация полезная по ошибке.

источник

00:41пожаловаться #18

VG

Viktor Ganeles in QA — Load & Performance

I-1

Тут получаем топ ошибок с их причинами.
Обработка файла xml логов лисенера, достаточно errors only.

Данные примеры не слишком показательны, потому что там текст ошибки был в теле ответа, а response code всегда 200.
Обычно код не 200, и в response message всё-таки есть информация полезная по ошибке.

Это для людей, консоль любят больше чем гуи

Мне же нужно парой кликов мышки с комфортом выделить нужный отрезок теста и увидеть, что именно в этот отрезок теста начали валиться эти операции.

У меня большинство тестов ступенчатые, и проблемы начинаются в определённом месте.
Ну и мне важно, сто при нагрузке в 120% валятся толькл операции X (не критичные), а при нагрузке 180% начали валиться все операции.

Но вообще за способ большое спасибо - я не воспринимал grep как инструмент анализа форматированного хмл, а зря.

источник

09:16пожаловаться #19

VG

Viktor Ganeles in QA — Load & Performance

Kirill Yurkov

а чем плохо решение, когда при фейле семпла пишется респонс в инфлюкс через хттп, ему можно добавить айди закуска и семпл в котором был фейл. БД не распухает - я поставил жизнь на эту таблицу 2 недели, потом удаляется. проанализрвал с удобствами и все

А как ты это сделал?
Я думал, что бэкенд листер пишет всё в одну таблицу

источник

09:17пожаловаться #20