Size: a a a

2020 December 16

MB

Mikhail Butalin in Data Engineers
у мсеня паркет
источник

UD

Uncel Duk in Data Engineers
ну или какой-нибудь кликхаус возьмите
источник

MB

Mikhail Butalin in Data Engineers
вопрос не в том что взять
источник

MB

Mikhail Butalin in Data Engineers
а как эфективнее использовать имеющееся
источник

S

Stanislav in Data Engineers
партиции удачно сделать - все что можно сделать
источник

MB

Mikhail Butalin in Data Engineers
там гора таблиц в паркете
источник

MB

Mikhail Butalin in Data Engineers
партиции - да, есть
источник

S

Stanislav in Data Engineers
ну вот вопрос
источник

MB

Mikhail Butalin in Data Engineers
но когда архив за несколько лет
источник

S

Stanislav in Data Engineers
их может быть слишком много
источник

S

Stanislav in Data Engineers
что породит слишком много файлов
источник

MB

Mikhail Butalin in Data Engineers
я почему и подумал что даже если партиции грамотные, но большие, то всёравно фулскан по партиции
источник

MB

Mikhail Butalin in Data Engineers
так?
источник

S

Stanislav in Data Engineers
тут вопрос - что такое большие )
какого размера паркеты внизу?
какого размера партиции?
ими вообще аналитики пользуются?
источник

S

Stanislav in Data Engineers
а то бывает
источник

MB

Mikhail Butalin in Data Engineers
большие - это 1 блок и более
источник

MB

Mikhail Butalin in Data Engineers
ну, т.е. партиций менее 256мб нет
источник

S

Stanislav in Data Engineers
похоже их слишком много
а файлы там какие?
что такое партиция то? стандартный 1 день?
источник

AZ

Anton Zadorozhniy in Data Engineers
Mikhail Butalin
я почему и подумал что даже если партиции грамотные, но большие, то всёравно фулскан по партиции
А какие запросы? Агрегаты какие-то или просто строчки по сильно селективному ключу?
источник

N

Nikita Blagodarnyy in Data Engineers
Stanislav
тогда по идее наложить маску на путь до модуля
не работал с таким мавеном, а вот в сбт с модулями вроде все так
вытащить путь до модуля, где произошли изменения и запустить там сбт тесты
непонятно, стоит ли прогонять такие штуки на обычные коммиты - жалко ресурсов
вот делать это на пул/мердж реквесты - да, а там как раз  появляются новые циферки в версиях
Все проще, Антон прав.

backend_build:
 stage: build
 only:
   changes:
     - "backend/**/*"


Вот тут подробно.
https://medium.com/swlh/on-monorepos-and-the-deployment-with-gitlab-ci-cd-bc080cfc6dce
источник