Size: a a a

2020 July 21

GP

Grigory Pomadchin in Data Engineers
тебе придется поддерживать базу в актуальном состоянии
источник

GP

Grigory Pomadchin in Data Engineers
либа на основе этого сделана http://efele.net/maps/tz/us/
источник

AE

Alexey Evdokimov in Data Engineers
чуваки с гитхаба это уже всё за меня делают, я прям готовые аутлайны беру
источник

AE

Alexey Evdokimov in Data Engineers
но за меня их на индексированное покрытие никто не разложит. и не разложил. вот и приходится самому как-то изобретать способ
источник

AE

Alexey Evdokimov in Data Engineers
но эт ещё только самое начало марлезонского балета. потом на полученную сетку ещё надо будет 35 млрд. точек подвесить. просто чтобы проверить пару гипотез. так, пробный проектик для презентации инвесторам.
источник

AE

Alexey Evdokimov in Data Engineers
посчитать пару показателей для 10% американцев. как они, бедняги, ковид переживают в июне en masse
источник

AE

Alexey Evdokimov in Data Engineers
ац ац ац.

а ведь в чём ещё жопа-то... чё я такой, думаю, зачем у меня индексы на границах с перекрытием генерятся? а ведь H3 полифил действительно сосёт. вон чё пишут: Get all hexagons with centers contained in a given polygon.

а покрытие гексами, которые содержатся в аутлайне целиком, у них пока только в RFC для версии 4.

и это, вообще говоря, беда.
источник

AE

Alexey Evdokimov in Data Engineers
вот покуда работаешь с маленькими странами типа британии или финки, где нет внутренних границ, эт не проблема
источник

ПФ

Паша Финкельштейн... in Data Engineers
Alexey Evdokimov
вот покуда работаешь с маленькими странами типа британии или финки, где нет внутренних границ, эт не проблема
думается для маленьких стран легче понимать по стране. Вопрос что делать с фигнёй типа России, Канады, кто там ещё
источник

A

Art in Data Engineers
Alexey Evdokimov
ац ац ац.

а ведь в чём ещё жопа-то... чё я такой, думаю, зачем у меня индексы на границах с перекрытием генерятся? а ведь H3 полифил действительно сосёт. вон чё пишут: Get all hexagons with centers contained in a given polygon.

а покрытие гексами, которые содержатся в аутлайне целиком, у них пока только в RFC для версии 4.

и это, вообще говоря, беда.
Texas, resolution 10, заняло ~5 минут. Такая ли проблема все таки?
источник

A

Art in Data Engineers
источник

SS

Sergey Sheremeta in Data Engineers
коллеги, подскажите где в Hive-каталоге хранится информация о бакетах?
в таблице BUCKETING_COLS пусто
источник

M

Mi in Data Engineers
Sergey Sheremeta
коллеги, подскажите где в Hive-каталоге хранится информация о бакетах?
в таблице BUCKETING_COLS пусто
А что требуется узнать? Может можно и без задней двери обратиться
источник

SS

Sergey Sheremeta in Data Engineers
нужна именно "задняя дверь"
источник

АЖ

Андрей Жуков... in Data Engineers
https://subsurfaceconf.com/summer2020/datalake2020
С нашим кейсом по Dremio :)
источник

SS

Sergey Sheremeta in Data Engineers
реально Dremio настолько хорош? он у вас как надстройка над DataLake?
источник

АЖ

Андрей Жуков... in Data Engineers
Sergey Sheremeta
реально Dremio настолько хорош? он у вас как надстройка над DataLake?
хорошая балалайка поверх даталейки для бизнес-пользователей
со своими тараканами, естественно
источник

SS

Sergey Sheremeta in Data Engineers
у вас OSS-версия? как рулите инкрементальным рефрешами и чем визуализируете материализации Дремио?
источник

АЖ

Андрей Жуков... in Data Engineers
Sergey Sheremeta
у вас OSS-версия? как рулите инкрементальным рефрешами и чем визуализируете материализации Дремио?
у нас EE

инкрементальные рефлекшены норм, вот ретроспективные - больно :)
airflow для пинков метаданных и рефлекшенов, spark для больших таблиц и ретроспективный апдейтов
источник

АЖ

Андрей Жуков... in Data Engineers
визуализация в Табло
источник