Size: a a a

2020 September 10

A

Alex in Data Engineers
Sergey Sheremeta
а я и не шутил
известная проблема когда рассказываешь чем занимаешься
многие думают что стёб …. но нет
источник

DZ

Dmitry Zuev in Data Engineers
Евгений Глотов
Вот вы смеётесь, а бигдата идёт к пользователям. Недавно писал вставку хардкод питоном в нужные ячейки экселя прямо в xml-файлы, потому что стандартными либами 40 листов с фотками и пивот таблицами читаются 10 минут)
эксель бигдата это когда клиент просит парсить гиговые эксльки с фотками в комментах
источник

А

Алексей in Data Engineers
Евгений правильно пишет, что когда xlsx стало возможно парсить без Ole, просто разархивировав и прочитав xml, жить стало значительно проще
источник

N

Nikita Blagodarnyy in Data Engineers
Andrew Konstantinov
Всем привет! Какой best practice когда прилетает новое поле в Спарк стриминге ? Как на лету можно изменить витрину данных ?
delta позволяет писать с опцией merge schema
источник

N

Nikita Blagodarnyy in Data Engineers
To enable schema migration, please set:
'.option("mergeSchema", "true")\'
источник

AG

Alexander Gorokhov in Data Engineers
А я помню они на реддите пиарились, юай этот несвоьодный. Чтобы им пользоваться спарк должен свои ивенты на их сервера отправлять.
источник

AZ

Anton Zadorozhniy in Data Engineers
Alexander Gorokhov
А я помню они на реддите пиарились, юай этот несвоьодный. Чтобы им пользоваться спарк должен свои ивенты на их сервера отправлять.
ну конечно, это их фишка
источник

AG

Alexander Gorokhov in Data Engineers
Как по мне это путь в никуда
источник

AZ

Anton Zadorozhniy in Data Engineers
в каком смысле?
источник

AG

Alexander Gorokhov in Data Engineers
Кто в своём уме будет встраивать в продакшен либу которая что-то шлёт  3party серверам?
источник

АЖ

Андрей Жуков... in Data Engineers
Alexander Gorokhov
Кто в своём уме будет встраивать в продакшен либу которая что-то шлёт  3party серверам?
датабрикс вроде жив
источник

AG

Alexander Gorokhov in Data Engineers
Андрей Жуков
датабрикс вроде жив
Вы не понимаете это другое
источник

AZ

Anton Zadorozhniy in Data Engineers
Кто пользуется databricks, emr и dataflow? на сторонних серверах!
источник

АЖ

Андрей Жуков... in Data Engineers
Alexander Gorokhov
Вы не понимаете это другое
источник

AG

Alexander Gorokhov in Data Engineers
Anton Zadorozhniy
Кто пользуется databricks, emr и dataflow? на сторонних серверах!
Датабрикс тут кстати другая песня, вычислительных ресурсы ведь в аккаунте заказчика выделяются
источник

AZ

Anton Zadorozhniy in Data Engineers
Alexander Gorokhov
Датабрикс тут кстати другая песня, вычислительных ресурсы ведь в аккаунте заказчика выделяются
у датамеханикс точно также
источник

AG

Alexander Gorokhov in Data Engineers
Anton Zadorozhniy
у датамеханикс точно также
Это понятно. Но дашборд они пиарили как нечто стандалон от их системы
источник

AG

Alexander Gorokhov in Data Engineers
И чтобы его использовать нужно встроить либу которая будет слать им ивенты. Не понимаю почему сам дашборд в либе не может рисоваться?
источник

AG

Alexander Gorokhov in Data Engineers
Хотя нет, понимаю. Из-за бабла
источник

АЖ

Андрей Жуков... in Data Engineers
Alexander Gorokhov
Хотя нет, понимаю. Из-за бабла
любой вендор мечтает о вендорлоке
источник