Телеграмм чат группы dba

2020 December 26

N

Natali in DBA - русскоговорящее сообщество

которые крупные- много статей на тему выпускают

источник

23:13пожаловаться #1

2020 December 27

AL

Aleksey Lex-sey in DBA - русскоговорящее сообщество

Добрый день коллеги возникла проблема с написанием запроса в clickhouse.
есть таблица progress_documents вида

session_id uuid - идентификатор сессии
document_id int - номер документа в обработке
server_time data_time - серверное время
state boolean - статус
server_date date- дата

Записи в неё добавляются каждые 30с.
Необходимо
1. Для всех session_id вычислить время обработки документа (взять разность server_time двух соседних записей и все такие разности просумировать).
в одной сесси могут обрабатываться несколько документов.

Моя идея была в том что бы брать соседние записи с помощью функции neighbor и затем суммировать
select sum(server_time - next_ts) as result from (select server_time, neighbor(server_time, 1, NULL) as next_server_time from progress_documents

Вопрос как сделать это для всех session_id и всех document_id. Буду благодарен за любые подсказки

источник

10:11пожаловаться #2

ВТ

Виктор Ткаченко... in DBA - русскоговорящее сообщество

Aleksey Lex-sey

Добрый день коллеги возникла проблема с написанием запроса в clickhouse.
есть таблица progress_documents вида

session_id uuid - идентификатор сессии
document_id int - номер документа в обработке
server_time data_time - серверное время
state boolean - статус
server_date date- дата

Записи в неё добавляются каждые 30с.
Необходимо
1. Для всех session_id вычислить время обработки документа (взять разность server_time двух соседних записей и все такие разности просумировать).
в одной сесси могут обрабатываться несколько документов.

Моя идея была в том что бы брать соседние записи с помощью функции neighbor и затем суммировать
select sum(server_time - next_ts) as result from (select server_time, neighbor(server_time, 1, NULL) as next_server_time from progress_documents

Вопрос как сделать это для всех session_id и всех document_id. Буду благодарен за любые подсказки

Проверять session_id и document_id соседней записи и обрабатывать в зависимости изменились или нет

источник

15:18пожаловаться #3

2020 December 28

V

V in DBA - русскоговорящее сообщество

Здравствуйте, товарищи.

Вопрос по выборке и хранению данных в InfluxDB

Есть ли возможность как-то ускорить текущую выборку или оптимизировать структуру хранения данных?

Данные разнесены по разным таблицам для осуществления фильтрации. Также несколько таблиц нужны, т.к. одной временной метке может соответствовать набор записей в каждой таблице. А сопоставлять данные необходимо в рамках одной временной метки.

https://pastebin.com/0aB2efPT

Pastebin

flux query - Pastebin.com

Pastebin.com is the number one paste tool since 2002. Pastebin is a website where you can store text online for a set period of time.

источник

09:43пожаловаться #4

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество

V

Здравствуйте, товарищи.

Вопрос по выборке и хранению данных в InfluxDB

Есть ли возможность как-то ускорить текущую выборку или оптимизировать структуру хранения данных?

Данные разнесены по разным таблицам для осуществления фильтрации. Также несколько таблиц нужны, т.к. одной временной метке может соответствовать набор записей в каждой таблице. А сопоставлять данные необходимо в рамках одной временной метки.

https://pastebin.com/0aB2efPT

Pastebin

flux query - Pastebin.com

Pastebin.com is the number one paste tool since 2002. Pastebin is a website where you can store text online for a set period of time.

Обычно в этом помогают индексы

источник

09:44пожаловаться #5

V

V in DBA - русскоговорящее сообщество

я, честно говоря, не уверен, что я правильно организовал структуру базы. Или правильно использую join. Чудовищно медленно получается по 4 секунды на запрос

источник

09:45пожаловаться #6

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество

V

я, честно говоря, не уверен, что я правильно организовал структуру базы. Или правильно использую join. Чудовищно медленно получается по 4 секунды на запрос

Ну, тогда шли структуру, запрос и время выполнения.

Что за ин-флюс я конечно не знаю, но если это реляционная БД, это не важно

источник

09:49пожаловаться #7

V

V in DBA - русскоговорящее сообщество

это TSDB

источник

09:49пожаловаться #8

V

V in DBA - русскоговорящее сообщество

структуру сейчас нарисую, запрос в пасте

источник

09:49пожаловаться #9

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество

V

структуру сейчас нарисую, запрос в пасте

А, это не запрос, я это не смогу

источник

09:51пожаловаться #10

V

V in DBA - русскоговорящее сообщество

это запрос на Flux. Выглядит вот так вот чудовищно

источник

09:51пожаловаться #11

V

V in DBA - русскоговорящее сообщество

SQL-like influxQL они дропнули в последней версии

источник

09:51пожаловаться #12

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество

V

это запрос на Flux. Выглядит вот так вот чудовищно

Индекс есть по
["_start", "_stop", "_time", "guest_session_id", "user_id", "username"]

?

источник

09:55пожаловаться #13

V

V in DBA - русскоговорящее сообщество

да

источник

09:55пожаловаться #14

V

V in DBA - русскоговорящее сообщество

это тэги - индексируемые поля

источник

09:55пожаловаться #15

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество

V

это тэги - индексируемые поля

Составной из 6 полей?

источник

09:56пожаловаться #16

V

V in DBA - русскоговорящее сообщество

нужно уточнить как это работает, возможно, нет

источник

09:56пожаловаться #17

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество

V

нужно уточнить как это работает, возможно, нет

Уточняй, и это у тебя в нескольких таблицах

источник

09:58пожаловаться #18

V

V in DBA - русскоговорящее сообщество

Это и параметры запроса формально, является fk по которому таблицы объединяются в один запрос.
Только, собственно, без таблицы request. Посчитал, что на ней можно сэкономить. Возможно, это ошибка

источник

10:05пожаловаться #19

V

V in DBA - русскоговорящее сообщество

V

структуру сейчас нарисую, запрос в пасте

https://dbdiagram.io/d/5fe9875f9a6c525a03bc722b

dbdiagram.io

A Free Database Designer for Developers and Analysts

Quick and simple free tool to help you draw your database relationship diagrams and flow quickly using just keyboard

источник

10:21пожаловаться #20