Size: a a a

2021 March 24

SO

Simon Osipov in Data Engineers
No Name
А кластер большой?)
табло или GP?
источник

NN

No Name in Data Engineers
Simon Osipov
табло или GP?
Табло
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
No Name
А это как?
Как как, у табло в беке постгрес и редис для кеша
источник

SO

Simon Osipov in Data Engineers
No Name
Табло
3 машины, SSD, 1 TB
источник

NN

No Name in Data Engineers
Vladislav 👻 Shishkov
Как как, у табло в беке постгрес и редис для кеша
Ну, окей, переформулирую - как себя чувствует постгрес и редис для кеша с большими данными?
источник

АЖ

Андрей Жуков... in Data Engineers
Simon Osipov
Ребят, а расскажите про ограничения в Tableu про объемы данных?
Представим себе, есть Greenplum, в нем много-много строк (пара миллиардов, например, на 3-5 колонок)
Как себя tableu чувствует с большими данными?

Очень размыто, конечно, спросил, но оч надеюсь, что понятно)))
ты хочешь таблицу в таблошечкук выгружать? о_О
источник

SO

Simon Osipov in Data Engineers
Simon Osipov
Ребят, а расскажите про ограничения в Tableu про объемы данных?
Представим себе, есть Greenplum, в нем много-много строк (пара миллиардов, например, на 3-5 колонок)
Как себя tableu чувствует с большими данными?

Очень размыто, конечно, спросил, но оч надеюсь, что понятно)))
Добавлю контекста:
У нас есть часть визуализации данных в табло, а часть данных мы отдаем по API написанному
И вот эта вторая часть с API появилась потому (тут туман войны) что якобы табло не переваривает такие объемы

А моя идея в том, что зачем нам делать API, если в табло есть уже возможности выгрузок
источник

АЖ

Андрей Жуков... in Data Engineers
наши  аналитики тоже так хотят, конечно, “потому что дримиво долго запрос выполняет"
источник

АЖ

Андрей Жуков... in Data Engineers
а там кросс-джоин терабайт на терабайт
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Андрей Жуков
ты хочешь таблицу в таблошечкук выгружать? о_О
Да, есть такая категория людей, которая на табло пытаются переложить rolap
источник

SO

Simon Osipov in Data Engineers
ну так вот выгрузка вообще без джойнов, просто сплошняком выгрузка с фильтрацией по ключу
источник

АЖ

Андрей Жуков... in Data Engineers
Simon Osipov
ну так вот выгрузка вообще без джойнов, просто сплошняком выгрузка с фильтрацией по ключу
ну ты посчитай, сколько такой запрос в несжатом виде будет весить на выходе
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Simon Osipov
Добавлю контекста:
У нас есть часть визуализации данных в табло, а часть данных мы отдаем по API написанному
И вот эта вторая часть с API появилась потому (тут туман войны) что якобы табло не переваривает такие объемы

А моя идея в том, что зачем нам делать API, если в табло есть уже возможности выгрузок
Хреновая идея
источник

SO

Simon Osipov in Data Engineers
Vladislav 👻 Shishkov
Хреновая идея
Почему?
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Потому что: вендорлок, скорость говно на уровне экстрактов, скорость говно на уровне запросов
источник

SO

Simon Osipov in Data Engineers
Андрей Жуков
ну ты посчитай, сколько такой запрос в несжатом виде будет весить на выходе
ты имеешь ввиду размер исходящего файла?
источник

SO

Simon Osipov in Data Engineers
Vladislav 👻 Shishkov
Потому что: вендорлок, скорость говно на уровне экстрактов, скорость говно на уровне запросов
Представим себе, что вендорлок уже прошедшее событие, на которое повлиять никак нельзя
источник

АЖ

Андрей Жуков... in Data Engineers
Simon Osipov
ты имеешь ввиду размер исходящего файла?
угу
и станет поноятно, сколько ему ресурсов надо будет, чтоб экстракт сложить
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Simon Osipov
Представим себе, что вендорлок уже прошедшее событие, на которое повлиять никак нельзя
Вы понимаете, что архитектурно делаете ненужную прослойку ввиде табло?
источник

АЖ

Андрей Жуков... in Data Engineers
лучше уж лайв-конект
источник