Size: a a a

2020 June 25

АЖ

Аня Жук in Чат Tableau
в статье про производительность табло пишут, что каунт дистинкт по возможности лучше избегать. но у меня на моих 100 млн в экстракте  работает что каунт что каунт дистинкт примерно одинаково (около 20 милисекунд). что я делаю не так?
источник

EL

Egor Larin in Чат Tableau
Аня Жук
в статье про производительность табло пишут, что каунт дистинкт по возможности лучше избегать. но у меня на моих 100 млн в экстракте  работает что каунт что каунт дистинкт примерно одинаково (около 20 милисекунд). что я делаю не так?
20 млсеквроде ок нет?)
источник

EL

Egor Larin in Чат Tableau
Аня Жук
для порядку) и раньше там вроде за правильные ответы на форуме что то присваивалось)
ага))пожизненную лицензию табло)
источник

АЖ

Аня Жук in Чат Tableau
Egor Larin
20 млсеквроде ок нет?)
ок) но я понять хочу когда его избегать нужно. я вот никогда не избегала
источник

EL

Egor Larin in Чат Tableau
Аня Жук
ок) но я понять хочу когда его избегать нужно. я вот никогда не избегала
ну это ж больше sql правило, и то просто рекомендация
источник

EL

Egor Larin in Чат Tableau
не уверен причем тут табло
источник

EL

Egor Larin in Чат Tableau
в люой систему или бд лучше июегать дистикнтов
источник

АЖ

Аня Жук in Чат Tableau
Egor Larin
ну это ж больше sql правило, и то просто рекомендация
это скл правило пришло из обычных субд ведь. для скл сервера это актуально. а для поколоночного хранения типа вертики не факт, его ведь для таких штук и придумали.
источник

АП

Артем Прытков... in Чат Tableau
Аня Жук
в статье про производительность табло пишут, что каунт дистинкт по возможности лучше избегать. но у меня на моих 100 млн в экстракте  работает что каунт что каунт дистинкт примерно одинаково (около 20 милисекунд). что я делаю не так?
может быть кэш, может быть кол-во уникальных значений не большое
источник

АЖ

Аня Жук in Чат Tableau
понятно что там где они ибыточны не нужно их впихивать
источник

АЖ

Аня Жук in Чат Tableau
Артем Прытков
может быть кэш, может быть кол-во уникальных значений не большое
без кэша, а с какого кол-ва уникальных будет заметна разница?
источник

LK

Loo Kat in Чат Tableau
Аня Жук
в статье про производительность табло пишут, что каунт дистинкт по возможности лучше избегать. но у меня на моих 100 млн в экстракте  работает что каунт что каунт дистинкт примерно одинаково (около 20 милисекунд). что я делаю не так?
Hyper хорошо умеет count distinct, зато плохо ntile. а вот вертика — наоборот. а exasol — и то и другое умеет хорошо.
источник

LK

Loo Kat in Чат Tableau
Loo Kat
Hyper хорошо умеет count distinct, зато плохо ntile. а вот вертика — наоборот. а exasol — и то и другое умеет хорошо.
если вендор написал оптимизированную функцию — то все хорошо.
источник

АЖ

Аня Жук in Чат Tableau
Loo Kat
если вендор написал оптимизированную функцию — то все хорошо.
я не поняла какой вендор что написал и что именно хорошо)))
источник

АЖ

Аня Жук in Чат Tableau
Loo Kat
Hyper хорошо умеет count distinct, зато плохо ntile. а вот вертика — наоборот. а exasol — и то и другое умеет хорошо.
спасибо) а это опыт или ты где-то прочитал как гипер устроен?
источник

LK

Loo Kat in Чат Tableau
Аня Жук
я не поняла какой вендор что написал и что именно хорошо)))
ну например exasol написал быстрый код и для count distinct (оптимайзер запрос преобразует в быстрый), и для ntile (там быстрая сортировка в виде компилируемой функции). а вот hyper — точнее разработчики hyper  — не написал(и) для ntile такой функции (пока что).
источник

LK

Loo Kat in Чат Tableau
Аня Жук
спасибо) а это опыт или ты где-то прочитал как гипер устроен?
опытным путем конечно
источник

АЖ

Аня Жук in Чат Tableau
Loo Kat
ну например exasol написал быстрый код и для count distinct (оптимайзер запрос преобразует в быстрый), и для ntile (там быстрая сортировка в виде компилируемой функции). а вот hyper — точнее разработчики hyper  — не написал(и) для ntile такой функции (пока что).
ааа понятно) а почему если каунт дистинкт хорошо на гипер работает его рекомендуют избегать? 🧐
источник

LK

Loo Kat in Чат Tableau
Аня Жук
ааа понятно) а почему если каунт дистинкт хорошо на гипер работает его рекомендуют избегать? 🧐
может потому что он ресурсоемкий
источник

АП

Артем Прытков... in Чат Tableau
Аня Жук
ааа понятно) а почему если каунт дистинкт хорошо на гипер работает его рекомендуют избегать? 🧐
Потому что так написано в библии по оптимизации производительности Табло )
источник