Size: a a a

2020 November 05

R

Renarde in Data Engineers
Алексей
честно сказать понятнее не стало от 2 ссылки. Понял, что zorder позволяет делать фильтрацию по нескольким колонкам, но тоже самое могут и блум фильтры. Делается ли repartition и сортировка при вызове zorder?
про наличие repartition сказать не могу - оригинальный код не видел, но если хочется совсем деталей имплементации - вот Delta VLDB Paper, Z-Ordering в параграфе 4.4 описан по действиям.

https://databricks.com/wp-content/uploads/2020/08/p975-armbrust.pdf
источник

AS

Andrey Smirnov in Data Engineers
Renarde
про наличие repartition сказать не могу - оригинальный код не видел, но если хочется совсем деталей имплементации - вот Delta VLDB Paper, Z-Ordering в параграфе 4.4 описан по действиям.

https://databricks.com/wp-content/uploads/2020/08/p975-armbrust.pdf
интересно, то что касается z-ordering ссылается на статью 1966 года!
G. M. Morton. A computer oriented geodetic data base; and anew technique in file sequencing. IBM Technical Report,1966.
источник

R

Renarde in Data Engineers
Andrey Smirnov
интересно, то что касается z-ordering ссылается на статью 1966 года!
G. M. Morton. A computer oriented geodetic data base; and anew technique in file sequencing. IBM Technical Report,1966.
ничто не ново под луной 🤷
источник

R

Renarde in Data Engineers
а нейросети придумали Пирс и Маккалок в 1943 - тоже инновация!
источник

AS

Andrey Smirnov in Data Engineers
Renarde
а нейросети придумали Пирс и Маккалок в 1943 - тоже инновация!
да, только как разрешить проблему xor придумали сильно позже
источник

AS

Andrey Smirnov in Data Engineers
Renarde
ничто не ново под луной 🤷
нашел скан этой переплетенной работы, прямо интересно стало
источник

AT

Al T in Data Engineers
а alluxio для presto кто-нить пробовал под EMR запустить?
источник

AS

Andrey Smirnov in Data Engineers
Renarde
про наличие repartition сказать не могу - оригинальный код не видел, но если хочется совсем деталей имплементации - вот Delta VLDB Paper, Z-Ordering в параграфе 4.4 описан по действиям.

https://databricks.com/wp-content/uploads/2020/08/p975-armbrust.pdf
спасибо за статью, теперь понятно почему называется Z-ordering, формулы вписанные руками в документ это так лампово :)
источник

R

Royko Andriy in Data Engineers
Добрый день, прошу прощения, что врываюсь в ваш чат сразу с нетехническим вопросом, если это сильно противоречит правилам сообщества удалите сообщение 😅
Хотел спросить кто проходил курсы от EPAM -  Data Quality Engineering?
Хотел бы в лс поставить некоторые вопросы, всем спасибо, всем хорошего дня😉
источник

C

Combot in Data Engineers
Melania Torina has been banned! Reason: CAS ban.
источник

nn

nasdaq nice in Data Engineers
в pyspark (3.0.0) вообще возможно зарегать джавовый udaf?
источник
2020 November 06

SS

Sergey Sheremeta in Data Engineers
дяденьки, посоветуйте какую-нибудь библиотеку на Scala для Http-запросов с пуллингом соединений
источник

GP

Grigory Pomadchin in Data Engineers
Sergey Sheremeta
дяденьки, посоветуйте какую-нибудь библиотеку на Scala для Http-запросов с пуллингом соединений
sttp
источник

SS

Sergey Sheremeta in Data Engineers
спасибо!
источник

AS

Andrey Smirnov in Data Engineers
а какой backend к ней посоветуете?
источник

GP

Grigory Pomadchin in Data Engineers
Andrey Smirnov
а какой backend к ней посоветуете?
ну это уже от стека который используется зависит https://github.com/softwaremill/sttp/blob/master/docs/backends/summary.md я бы хттп4с использовал - стриминг норм поддерживает и тп
источник

GP

Grigory Pomadchin in Data Engineers
ну или начал с него а потом понял почему он не нужен к примеру
источник

GP

Grigory Pomadchin in Data Engineers
если акка везде - то почему бы акковый не взять
источник

GP

Grigory Pomadchin in Data Engineers
и тп
источник

АА

Алексей Артамонов... in Data Engineers
всем привет! А кто подскажет в jupyterhub авторизуюсь через PAM получаю ошибку PAM Authentication failed
пользователь добавлен в группу jupyterhub
источник