Size: a a a

2020 November 11

T

T in Data Engineers
T
А зачем их противопосталять если они обычно везде в месте используются. Что я наблюдаю в своей деревне то что питух используется для склейки: деплоймент, лямбды ит тд. + Он для ad-hoc отлично подходит нафигачил чего нить в ipython проверил и забыл. А скала больше в паплайнах , spark, flink, Akka. Ну и у нас в команде точно такой же сценарий и спользования их.
P.s.
На вопрос что учить из них двоих первым. Я бы советовал начинать с питона.
Но это я живу в стране где скала победила. В СНГ она может быть не такой популярной
источник

T

T in Data Engineers
No Name
А для нубья, которое только в питон умеет, с чего разумнее начать, с джабы или скалы?
Я бы посоветовал начать с java, ну с JVM в часности: как сборщики мусора работаю, модель памяти и тд. Потом в скалу будет сильно легче выкатиться меньше wtf будет. Но если время не ждёт то можно сразу в скалу.
источник

NN

No Name in Data Engineers
T
Я бы посоветовал начать с java, ну с JVM в часности: как сборщики мусора работаю, модель памяти и тд. Потом в скалу будет сильно легче выкатиться меньше wtf будет. Но если время не ждёт то можно сразу в скалу.
Время вроде как ждёт. Пасиб.
источник

ME

Max Efremov in Data Engineers
Panchenko Andrey
Не. Не спарк у меня Клауд инфраструктура. Лямбды и вот это вот всё
В aws glue есть pyspark)
источник

PA

Panchenko Andrey in Data Engineers
Max Efremov
В aws glue есть pyspark)
у меня гугловый клауд. там есть data proc. но ненастолько у нас много данных)
источник

PA

Panchenko Andrey in Data Engineers
я юзаю dataflow и apache beam для пайпланов на питонячем sdk
источник

D

Dmitry in Data Engineers
Коллеги, а поделитесь опытом - кто как документирует развёрнутые решения.
Это касается и архитектуры - какое ПО / компонент на какой машине развёрнуты и что делает, какие порты занимает, и разработанного кода - тоже, что написано, какую функцию выполняет, что на входе и на выходе.
источник

D

Dmitry in Data Engineers
Я для себя какие-то вещи в документы пишу, что-то на видео снимаб с комментариями, но системы нет.
источник

DZ

Dmitry Zuev in Data Engineers
видео это какой то треш
источник

E

Evgeny in Data Engineers
Dmitry
Коллеги, а поделитесь опытом - кто как документирует развёрнутые решения.
Это касается и архитектуры - какое ПО / компонент на какой машине развёрнуты и что делает, какие порты занимает, и разработанного кода - тоже, что написано, какую функцию выполняет, что на входе и на выходе.
в целом, consul довольно удобен - он же и учет, и дока какая-никакая. И сервисы на живость проверять можно и перенацеливать. Но все от архитектуры зависит, пожалуй
источник

ME

Max Efremov in Data Engineers
Документация в виде видео!?
источник

АЖ

Андрей Жуков... in Data Engineers
Мы пытаемся придерживаться https://c4model.com/
источник

OA

Oleksandr Averchenko in Data Engineers
Андрей Жуков
Мы пытаемся придерживаться https://c4model.com/
О я как раз зашел на заказчика который плотно сидит на C4.
источник

АР

Андрей Романов... in Data Engineers
https://yandex.ru/promo/oda/useful

смотрите, оказывается есть перечень открытых данных, доступных всем
источник

АР

Андрей Романов... in Data Engineers
интересно для анализа наверное
источник

D

Dmitry in Data Engineers
Max Efremov
Документация в виде видео!?
видео делаю в плане настройки и работы готовой системы - что куда нажимал, зачем и что было на выходе. Это для себя, технические моменты, чтобы помнить, если / когда через пол-года нужно будет вернуться и осознать, что было сделано на конкретном проекте и как работает.
источник

АЖ

Андрей Жуков... in Data Engineers
Андрей Романов
https://yandex.ru/promo/oda/useful

смотрите, оказывается есть перечень открытых данных, доступных всем
Как они нагло срисовали идею у Вани Бегтина :)
источник

DZ

Dmitry Zuev in Data Engineers
Dmitry
видео делаю в плане настройки и работы готовой системы - что куда нажимал, зачем и что было на выходе. Это для себя, технические моменты, чтобы помнить, если / когда через пол-года нужно будет вернуться и осознать, что было сделано на конкретном проекте и как работает.
это все равно какая то жесть
источник

АР

Андрей Романов... in Data Engineers
Андрей Жуков
Как они нагло срисовали идею у Вани Бегтина :)
а кто это?
источник

АР

Андрей Романов... in Data Engineers
я просто не знаю, извините
источник