Size: a a a

2021 October 26

UD

Uncel Duk in Data Engineers
И получаешь взлом жопы, нужно еще больше, чтобы чинить баги самих продуктов
источник

ЕГ

Евгений Глотов... in Data Engineers
Не вижу проблемы для бизнеса
источник

AZ

Anton Zadorozhniy in Data Engineers
sunk cost fallacy
источник

AZ

Anton Zadorozhniy in Data Engineers
так а спарк тут причем?
источник

ЕГ

Евгений Глотов... in Data Engineers
Спарк эскуэль
источник

AZ

Anton Zadorozhniy in Data Engineers
ну в нем проблема же
источник

ЕГ

Евгений Глотов... in Data Engineers
В чём конкретно
источник

AZ

Anton Zadorozhniy in Data Engineers
тормозит, низкая утилизация, хрупкий в плане тулинга, обновления требуют ресурсов
источник

UD

Uncel Duk in Data Engineers
Угу
источник

UD

Uncel Duk in Data Engineers
Внезапно оказывается что опенсурс это не бесплатно совсем
источник

AZ

Anton Zadorozhniy in Data Engineers
никогда не был
источник

UD

Uncel Duk in Data Engineers
А тэо считали левой пяткой
источник

ЕГ

Евгений Глотов... in Data Engineers
А что значит низкая утилизация?
источник

AZ

Anton Zadorozhniy in Data Engineers
ну и получается что можно конечно на S3 файлики спарком считать, но если сами приложения делают реплику сырых данных прямо в сноуфлейке - зачем все эти кластера, управление памятью и экзекьюторами
источник

GP

Grigory Pomadchin in Data Engineers
а как он тормозит? там теже экспрешоны просто через стринги
источник

GP

Grigory Pomadchin in Data Engineers
т.е. он такойж как обычные датафреймы
источник

GP

Grigory Pomadchin in Data Engineers
т.е. не то что такойж суть вся в этом
источник

ЕГ

Евгений Глотов... in Data Engineers
Наверно про то, что спарк вместе с датафреймами тормозит относительно чего-то ещё)
источник

GP

Grigory Pomadchin in Data Engineers
а, ну тогда да
источник

AZ

Anton Zadorozhniy in Data Engineers
не умеет как следует нагрузить железо, оверхеды всякие (YARN, JVM memory management)
источник