Size: a a a

2020 October 13

ME

Max Efremov in Data Engineers
Андрей Жуков
Там еще и коалас есть,  чтоб дсы точно ножку не подвернули :)
ох, чего только нет)
источник

AA

Anton Alekseev in Data Engineers
Андрей Жуков
Да,  примерно так я и выглядел,  посмотрев в логи драйвера :)
Это я ногу стараюсь не подвернуть😁
источник

ME

Max Efremov in Data Engineers
DE больше не нужны, DS могут пандас в кластере крутить сразу?
источник

AE

Alexey Evdokimov in Data Engineers
одно дело дать дсу поиграться с маленькой выборкой
источник

AE

Alexey Evdokimov in Data Engineers
совсем другое когда надо поставить на поток и заавтоматизировать настоящую выборку для прода
источник

AE

Alexey Evdokimov in Data Engineers
тут блин с питоном вылететь в трубу как нефиг делать
источник

AE

Alexey Evdokimov in Data Engineers
кому блин нужны проекты за десятки тыщ $... да ни у кого столько бабла нет.
источник

AE

Alexey Evdokimov in Data Engineers
вот 40$ за один расчёт совсем другое дело, это продаётся
источник

ME

Max Efremov in Data Engineers
pyspark вроде не особо медленнее спарка на скале
источник

ME

Max Efremov in Data Engineers
в UDF были вроде сложности, но кажется их решили
источник

АЖ

Андрей Жуков... in Data Engineers
Max Efremov
pyspark вроде не особо медленнее спарка на скале
в кубах намного больнее за счет умения пейтона уйти из рамок контейнера
источник

AE

Alexey Evdokimov in Data Engineers
мы за три года примерно так и смасштабировались. от ~4000$ за одиночный проект по <миллионным датасетам до 40$ за проект по сотням миллионов сырых записей по подписной модели. но приходится байты и циклы считать
источник

AE

Alexey Evdokimov in Data Engineers
ну и сильно морочиться с алгоритмикой
источник

AE

Alexey Evdokimov in Data Engineers
а ещё исключать человеческий фактор как самый дорогой
источник

AE

Alexey Evdokimov in Data Engineers
сказал бы мне кто три года тому, во что я ввязываюсь, подумал бы ещё, стоит ли :)
источник

ME

Max Efremov in Data Engineers
Андрей Жуков
в кубах намного больнее за счет умения пейтона уйти из рамок контейнера
О_о Интересно там. У нас по-старинке yarn ресурсами рулит
источник

A

Alex in Data Engineers
Max Efremov
в UDF были вроде сложности, но кажется их решили
вроде как они там и остались если UDF в чистом виде юзать без тех новых костылей, что напридумывали
источник

AX

Alex Xela in Data Engineers
Andrey Smirnov
Ты просишь совета, но делаешь это без уважения, так что бери карандаши и отрисовывай.
Мудило с одной «л» пишется?
источник

АЖ

Андрей Жуков... in Data Engineers
Max Efremov
О_о Интересно там. У нас по-старинке yarn ресурсами рулит
ну ты и сравни утилизацию
источник

UD

Uncel Duk in Data Engineers
Андрей Жуков
Там еще и коалас есть,  чтоб дсы точно ножку не подвернули :)
надо его внутри продать
источник