Size: a a a

2020 December 22

R

Renarde in Data Engineers
Alex
вот именно поэтому я точно так же считаю что в спарке вагон маркетинга, а не технологий =)

начиная с all in memory rdd, но спилим любой шафл на диск (даже на 5 рекордов)
и заканчивая “мы не map-reduce” =)
так в любой технологии, которая переехала из OSS в vendor-like будет вагон маркетинга 🤷‍♂️. Это реальность рынка, не свойство конкретного продукта
источник

A

Alex in Data Engineers
с этим согласен
источник

SS

Sergey Sheremeta in Data Engineers
а как попасть в Databricks? )
источник

T

T in Data Engineers
Sergey Sheremeta
а как попасть в Databricks? )
Вакансии на сайте, прям сейчас плюсовика ищут в амстер, вчера в линкидене наткнулся
источник

R

Renarde in Data Engineers
Sergey Sheremeta
а как попасть в Databricks? )
я все чаще думаю что пора блогпост об этом запилить.

Вкратце есть 4 опции для tech в Европе:
- internship
- platform / core dev
- field engineering (SA)
- RSA

первые две обычно имеют в виду релокацию в Амстердам, вторые две - не всегда (в смысле что вы должны уже быть где-то в EU).

Я проходил на SA 7 собесов (все по классике долины, хайринг везде плюс-минус одинаковый).
источник

T

T in Data Engineers
Renarde
я все чаще думаю что пора блогпост об этом запилить.

Вкратце есть 4 опции для tech в Европе:
- internship
- platform / core dev
- field engineering (SA)
- RSA

первые две обычно имеют в виду релокацию в Амстердам, вторые две - не всегда (в смысле что вы должны уже быть где-то в EU).

Я проходил на SA 7 собесов (все по классике долины, хайринг везде плюс-минус одинаковый).
В амстере кстати бывают позиции на SA а то я только в кор видел?
источник

GP

Grigory Pomadchin in Data Engineers
господа может в джобс?
источник

R

Renarde in Data Engineers
Grigory Pomadchin
господа может в джобс?
аргумент. молчу и повинуюсь
источник

AZ

Anton Zadorozhniy in Data Engineers
Renarde
я конечно извиняюсь, но если судить списки референсов, покажется что любой новый-модный-крутой фреймворк используется в Uber / Netflix / <any-big-tech-company>.
Реальность как обычно такова - есть одна-две-N хипстеркоманд, которые используют какой-то стек потому что им это нравится / job security / NIH syndrome.
В крупных IT это можно себе позволить, потому что в таких компаниях это хорошо заменяемые ресурсы (в том числе - взаимозаменяемые).
как раз если команда платформы мышей ловит то нужна одна-две команды чтобы написать и держать нормальный тулинг, чем говорить "у нас каждый сатанист если захочет сможет сделать свою платформу себе", и плодить shadow IT как сам-знаешь-кто 😊
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
вот именно поэтому я точно так же считаю что в спарке вагон маркетинга, а не технологий =)

начиная с all in memory rdd, но спилим любой шафл на диск (даже на 5 рекордов)
и заканчивая “мы не map-reduce” =)
amen brother
источник

NN

No Name in Data Engineers
Авы у них все лучше и лучше становятся, конечно. @pomadchin
источник

GP

Grigory Pomadchin in Data Engineers
No Name
Авы у них все лучше и лучше становятся, конечно. @pomadchin
ниговори я уже забанел не того
источник

GP

Grigory Pomadchin in Data Engineers
источник

NN

No Name in Data Engineers
Grigory Pomadchin
ниговори я уже забанел не того
Ну ты не раскисай там, это, все наладится ну и т.д.
источник
2020 December 23

e

er@essbase.ru in Data Engineers
Скажите пж. я правильно понимаю что AirFlow для Spark это просто *запускатель* scala программ ? Т.е.  нет инструментов , которые объединяли бы исходный код и расписание для его выполнения
источник

A

Alex in Data Engineers
А зачем их мешать?
источник

A

Alex in Data Engineers
Можете потыкать стримсет
источник

A

Alex in Data Engineers
Но вот про расписание там я не помню было или нет
источник

A

Alex in Data Engineers
источник

SS

Sergey Shushkov in Data Engineers
er@essbase.ru
Скажите пж. я правильно понимаю что AirFlow для Spark это просто *запускатель* scala программ ? Т.е.  нет инструментов , которые объединяли бы исходный код и расписание для его выполнения
Это называется оркестрация. А то что вы предлагаете это запуск события внутри системы по расписанию, что в данном случаи не практикуется.
источник