Size: a a a

2020 December 22

R

Renarde in Data Engineers
Timur Batyrshin
всем привет, а как сейчас модно запускать Flink на AWS?
из всего стека нужен только он (будет работать в связке с dolphinscheduler).
по прежнему EMR?
и еще как опция взять managed Flink от самих создателей - https://www.ververica.com/
источник

ME

Mikhail Epikhin in Data Engineers
О, прикольно, не слышал о таком
источник

A

Alex in Data Engineers
когда у них появилось?
источник

A

Alex in Data Engineers
раньше же саму платформу только продавали, а не клауд
источник

R

Renarde in Data Engineers
честно, я не очень в курсе. Я помню что они переименовались, а в прошлом году они у меня в линке стали часто светиться - ищем людей. Я не люблю флинк и не верю в него как в продукт 🤷‍♂️
источник

A

Alex in Data Engineers
было бы удивительно если бы сотрудник датабрикса верил в продукт конкурентов =)
источник

R

Renarde in Data Engineers
ну я не верил в него и до попадания в Датабрикс. В Z мы переписали один из пайплайнов с Флинка на Спарк
источник

A

Alex in Data Engineers
переименовались после того как их купил alitech
потому и мелькать стал, что денег больше появилось и уже не так сильно ограничены как “стартап”
источник

R

Renarde in Data Engineers
после этого в Z вроде флинка и не осталось нигде 🙂
источник

A

Alex in Data Engineers
uber/netflix/cisco/алибаба верят =) а кто-то не верит
вера это ведь такое, непостоянное и не всегда обоснованное

где-то имеет смысл пихать его, где-то нет
источник

N

Nikita Blagodarnyy in Data Engineers
Renarde
честно, я не очень в курсе. Я помню что они переименовались, а в прошлом году они у меня в линке стали часто светиться - ищем людей. Я не люблю флинк и не верю в него как в продукт 🤷‍♂️
А почему?
источник

R

Renarde in Data Engineers
Alex
uber/netflix/cisco/алибаба верят =) а кто-то не верит
вера это ведь такое, непостоянное и не всегда обоснованное

где-то имеет смысл пихать его, где-то нет
я конечно извиняюсь, но если судить списки референсов, покажется что любой новый-модный-крутой фреймворк используется в Uber / Netflix / <any-big-tech-company>.
Реальность как обычно такова - есть одна-две-N хипстеркоманд, которые используют какой-то стек потому что им это нравится / job security / NIH syndrome.
В крупных IT это можно себе позволить, потому что в таких компаниях это хорошо заменяемые ресурсы (в том числе - взаимозаменяемые).
источник

R

Renarde in Data Engineers
Nikita Blagodarnyy
А почему?
ну у меня есть объективные аргументы под NDA, и необъективные - мне не нравится java-like syntax во Флинке, и спарк я просто начинал учить раньше 🙂
источник

A

Alex in Data Engineers
ну вот так всегда начинается
как аргументы, так сразу NDA =)
источник

A

Alex in Data Engineers
ну и коре часть платформы называть хипстеркомандой тоже нужно уметь
источник

R

Renarde in Data Engineers
Alex
ну вот так всегда начинается
как аргументы, так сразу NDA =)
зачем делать бесплатно то, за что платят?  😁
источник

N

Nikita Blagodarnyy in Data Engineers
Renarde
зачем делать бесплатно то, за что платят?  😁
аргумент.
источник

A

Alex in Data Engineers
вот именно поэтому я точно так же считаю что в спарке вагон маркетинга, а не технологий =)

начиная с all in memory rdd, но спилим любой шафл на диск (даже на 5 рекордов)
и заканчивая “мы не map-reduce” =)
источник

R

Renarde in Data Engineers
Alex
ну и коре часть платформы называть хипстеркомандой тоже нужно уметь
от того, что это компонент core, это не исключает того что там могут быть хипстеркоманды.
Еще раз - аргумент то что какая-то OSS технология используется техгигантом - это очень слабый аргумент, если вы не аналогичный техгигант.
источник

A

Alex in Data Engineers
да, и спарк здесь ни лучше ни хуже =)
источник