Size: a a a

2020 October 08

E

Elijah in Data Engineers
здравствуйте
источник

E

Elijah in Data Engineers
ребят, подскажите, что зачастую идёт в комплекте на проекте, где есть Спарк? в плане либ
источник

YI

Yukari I in Data Engineers
Elijah
ребят, подскажите, что зачастую идёт в комплекте на проекте, где есть Спарк? в плане либ
А можете конкретизировать вопрос?
источник

E

Elijah in Data Engineers
Yukari I
А можете конкретизировать вопрос?
я слышал, что скалисты делятся на три условные категории:
- фп-челики (cats, scalaz, etc.)
- бывшие джависты, для которых фп-магия сложная и они просто хотят "slightly better Java"
- дата инженеры, которые спарк, хадуп и вот это все
источник

E

Elijah in Data Engineers
так вот, что используется на типичных дата инженерных проектах, где во главе стоит спарк?
источник

AZ

Anton Zadorozhniy in Data Engineers
Elijah
я слышал, что скалисты делятся на три условные категории:
- фп-челики (cats, scalaz, etc.)
- бывшие джависты, для которых фп-магия сложная и они просто хотят "slightly better Java"
- дата инженеры, которые спарк, хадуп и вот это все
это не эксклюзивные категории, они пересекаются
источник

AA

Anton Alekseev in Data Engineers
какой странный диалог
источник

ME

Max Efremov in Data Engineers
Elijah
ребят, подскажите, что зачастую идёт в комплекте на проекте, где есть Спарк? в плане либ
Питон ещё)
источник

E

Elijah in Data Engineers
Anton Zadorozhniy
это не эксклюзивные категории, они пересекаются
ну да, это очень условное деление
источник

MV

Mitya Volodin in Data Engineers
Elijah
так вот, что используется на типичных дата инженерных проектах, где во главе стоит спарк?
Да, обычно ещё Python, хотя бы для автоматизации.
Но если копнуть в инфраструктуру - очень по-разному всё бывает )
источник

E

Elijah in Data Engineers
ладно, проще будет с проекта дождаться ответа, чем гадать на кофейной гуще
источник

AE

Alexey Evdokimov in Data Engineers
чорт, такую зарубу про файловые системы пропустил
источник

AE

Alexey Evdokimov in Data Engineers
ещё помнится в 2012 я читал в епаме лекцию о том чё это такое и как это делается
источник

AE

Alexey Evdokimov in Data Engineers
если совсем кратко, то ФС — это некоторая семантика
источник

AE

Alexey Evdokimov in Data Engineers
и не более того. но и не менее. а что там под капотом никого не волнует.
источник

AZ

Anton Zadorozhniy in Data Engineers
Alexey Evdokimov
чорт, такую зарубу про файловые системы пропустил
в следующей серии: почему Hive это не RDBMS
источник

AE

Alexey Evdokimov in Data Engineers
а файл  — это соответственно минимальная семантическая единица файловой системы
источник

D

Dmitry in Data Engineers
Anton Zadorozhniy
в следующей серии: почему Hive это не RDBMS
потому что нет R, relations
источник

AA

Anton Alekseev in Data Engineers
Тут скорее интересует вопрос, выступает ли такой спорный вопрос на собесе редфлагом у ТС
источник

AE

Alexey Evdokimov in Data Engineers
хдфс по семантике таки всё же ФС. а вот с3 не является таковой.
источник