Телеграмм чат группы cloud

Господа.
Есть серьезный вопрос к тем, кто шарит в базах данных (реляционных и нет). За консультацию готов заплатить, если кто решится.

Имеем PostgreSQL 12 и таблицу в ней для хранения данных об эффективности рекламы. Размер таблицы на данный момент составляет ~300млн строк и каждый день увеличивается на 1-3 миллиона.
Каждый день несколько десятков или сотен раз нужно получать сводные данные из неё (SUM как основная функция), фильтровать и сортировать по вычисленным полям.

Пока что каждая операция занимает от 10 секунд до нескольких десятков минут.

Нужен эдвайс, как это говно денормализовать. Может, с использованием промежуточной БД для вычисленных значений (mongo, например).

Если кому интересна такая задача — ткните в личку, я дам файл с более детальным описанием текущего процесса и структурой нужных таблиц.

источник

00:45пожаловаться #5

SG

Sergey Gruzdov in cloud_flood

Mark Gromov

Господа.
Есть серьезный вопрос к тем, кто шарит в базах данных (реляционных и нет). За консультацию готов заплатить, если кто решится.

Имеем PostgreSQL 12 и таблицу в ней для хранения данных об эффективности рекламы. Размер таблицы на данный момент составляет ~300млн строк и каждый день увеличивается на 1-3 миллиона.
Каждый день несколько десятков или сотен раз нужно получать сводные данные из неё (SUM как основная функция), фильтровать и сортировать по вычисленным полям.

Пока что каждая операция занимает от 10 секунд до нескольких десятков минут.

Нужен эдвайс, как это говно денормализовать. Может, с использованием промежуточной БД для вычисленных значений (mongo, например).

Если кому интересна такая задача — ткните в личку, я дам файл с более детальным описанием текущего процесса и структурой нужных таблиц.

Купи постгрепро

источник

00:48пожаловаться #6

t

tsla in cloud_flood

Mark Gromov

Господа.
Есть серьезный вопрос к тем, кто шарит в базах данных (реляционных и нет). За консультацию готов заплатить, если кто решится.

Имеем PostgreSQL 12 и таблицу в ней для хранения данных об эффективности рекламы. Размер таблицы на данный момент составляет ~300млн строк и каждый день увеличивается на 1-3 миллиона.
Каждый день несколько десятков или сотен раз нужно получать сводные данные из неё (SUM как основная функция), фильтровать и сортировать по вычисленным полям.

Пока что каждая операция занимает от 10 секунд до нескольких десятков минут.

Нужен эдвайс, как это говно денормализовать. Может, с использованием промежуточной БД для вычисленных значений (mongo, например).

Если кому интересна такая задача — ткните в личку, я дам файл с более детальным описанием текущего процесса и структурой нужных таблиц.

А постгре xl разбить данные по разным инстансам, а эти инстансы на разных серверах?

источник

00:49пожаловаться #7

t

tsla in cloud_flood

Это типа партиции

источник

00:49пожаловаться #8

SG

Sergey Gruzdov in cloud_flood

А вообще etl

источник

00:49пожаловаться #9

t

tsla in cloud_flood

Sergey Gruzdov

Купи постгрепро

Не даёт профита, так-то

источник

00:49пожаловаться #10

t

tsla in cloud_flood

Кроме мульти мастера, который нах не всрался

источник

00:49пожаловаться #11

SG

Sergey Gruzdov in cloud_flood

tsla

Не даёт профита, так-то

Поддержке мозг ебать можно

источник

00:49пожаловаться #12

SG

Sergey Gruzdov in cloud_flood

Или переходите на нормальный скл

источник

00:50пожаловаться #13

t

tsla in cloud_flood

Если что можешь продублировать вопрос в @pgsql

источник

00:50пожаловаться #14

ВН

Виталий На Заборе... in cloud_flood

Mark Gromov

Господа.
Есть серьезный вопрос к тем, кто шарит в базах данных (реляционных и нет). За консультацию готов заплатить, если кто решится.

Имеем PostgreSQL 12 и таблицу в ней для хранения данных об эффективности рекламы. Размер таблицы на данный момент составляет ~300млн строк и каждый день увеличивается на 1-3 миллиона.
Каждый день несколько десятков или сотен раз нужно получать сводные данные из неё (SUM как основная функция), фильтровать и сортировать по вычисленным полям.

Пока что каждая операция занимает от 10 секунд до нескольких десятков минут.

Нужен эдвайс, как это говно денормализовать. Может, с использованием промежуточной БД для вычисленных значений (mongo, например).

Если кому интересна такая задача — ткните в личку, я дам файл с более детальным описанием текущего процесса и структурой нужных таблиц.

Я щас за это должен был взять видимо деньги, но TimescaleDB

источник

00:50пожаловаться #15

t

tsla in cloud_flood

Но, надо глянуть базу, мож у тебя не всё так плачевно

источник

00:51пожаловаться #16

t

tsla in cloud_flood

Виталий На Заборе

Я щас за это должен был взять видимо деньги, но TimescaleDB