Телеграмм чат группы data_architect страница 80

Кто работает с greenplum, подскажите плиз. Меня пытаются убедить, что при подключении больше чем 50 одновременных пользователей у базы начинаются проблемы, и это особенности базы. Что вроде как в Тинькофф есть гринплам, но есть и второе хранилище, как раз из-за этих проблем. Есть ли доля истины в этом?

источник

10:43пожаловаться #8

OP

O. Petr in Архитектура данных

Paul Golubev

Кто работает с greenplum, подскажите плиз. Меня пытаются убедить, что при подключении больше чем 50 одновременных пользователей у базы начинаются проблемы, и это особенности базы. Что вроде как в Тинькофф есть гринплам, но есть и второе хранилище, как раз из-за этих проблем. Есть ли доля истины в этом?

Лучше там спрашивать @greenplum_russia , там из арена даты сидят люди, они вам и более технически ответят, и мифы развеют, и услуги свои предложат ). 1) зависит от активности(сложности запросов) пользователей (открытых коннектов) и ресурсов самого кластера, мы сталкивались с тем что даже 2 больших запроса могли все положить, оказалось что дело в распределении ресурсов. 2) сомнительно звучит, что именно из за этого

источник

11:23пожаловаться #9

FL

Fedor Lavrentyev in Архитектура данных

У Greenplum сыровато с resource management'ом, он не умеет считать фактическое потребление памяти, только планируемое. Он умеет выделять по квоте памяти на каждый запрос. Если квоты на кластере больше нет, запрос становится в очередь. Таким образом, действительно, можно настроить кластер так, что он не сможет выполнять больше N параллельных запросов. А можно настроить с оверкоммитом по памяти, так что N будет сильно больше, но тогда иногда запросы будут забавно массово падать. Научить его относительному квотированию, preemption'у и анализу фактического потребления пока нельзя.

источник

12:53пожаловаться #10

PG

Paul Golubev in Архитектура данных

Спасибо, ценная инфа

источник

12:59пожаловаться #11

FL

Fedor Lavrentyev in Архитектура данных

У нас это пока ни разу не было проблемным местом. Правда, к концу квартала метрики могут выглядеть жарковато, а в мирное время я расстраиваюсь из-за недоутилизации кластера. :)

источник

13:24пожаловаться #12

e

er@essbase.ru in Архитектура данных

Fedor Lavrentyev

У Greenplum сыровато с resource management'ом, он не умеет считать фактическое потребление памяти, только планируемое. Он умеет выделять по квоте памяти на каждый запрос. Если квоты на кластере больше нет, запрос становится в очередь. Таким образом, действительно, можно настроить кластер так, что он не сможет выполнять больше N параллельных запросов. А можно настроить с оверкоммитом по памяти, так что N будет сильно больше, но тогда иногда запросы будут забавно массово падать. Научить его относительному квотированию, preemption'у и анализу фактического потребления пока нельзя.

какой работающий сценарий использования gp?

источник

17:44пожаловаться #13

FL

Fedor Lavrentyev in Архитектура данных

er@essbase.ru

какой работающий сценарий использования gp?

Оно в целом работает. :)
У нас GP это основная аналитическая лошадка.

источник

17:45пожаловаться #14

PG

Paul Golubev in Архитектура данных