Добрый день, подскажите, пожалуйста, какие азы стоит покрыть на Spark для джуна с каким-никаким опытом?
Также из этого вытекает следующий вопрос: на джаве или на пайтоне? Знания есть в обоих языках. Или это супер индивидуально для каждой компании и можно просто выбрать то, где комфортнее?
Всем привет. Можете подсказать(или дать линк на какую-нибудь хорошую статью), как лучше разметить датасет для задачи детектирования объекта на изображении?
А чем тебя не устраивает airflow вместе с экосистемой скала? Написал на скале, собрал, запустил в айрплов. Ну или по быдлячьи прям код без сборки толкнул. Там в айрплов код-то шаблонный, особо питон знать не надо.
тогда все изи - посмотри базовые вещи из Dataframe API - проекции, срезы, соединения, агрегаты, оконные функции, пользовательские функции, работа с файловыми форматами (json, csv, parquet, orc) - и в бой