Size: a a a

2021 September 24

t

tenKe in Data Engineers
ну и многие коннекторы до сих пор на в1
источник

DC

Denny Crane [not a Y... in Data Engineers
Она необычная с точки зрения внутреннего кх api. Я 22 года занимаюсь разными бд, термина udtf не встречал.
источник

R

Roman in Data Engineers
Спасибо
источник

AZ

Anton Zadorozhniy in Data Engineers
UDTF нет в таком термине в стандарте, но в отрасли он популярен, я работал с DB2 и Snowflake и там он есть, у нас аналог называется table operator
источник
2021 September 26

.

._. in Data Engineers
Добрый день, подскажите, пожалуйста, какие азы стоит покрыть на Spark для джуна с каким-никаким опытом?

Также из этого вытекает следующий вопрос: на джаве или на пайтоне? Знания есть в обоих языках. Или это супер индивидуально для каждой компании и можно просто выбрать то, где комфортнее?
источник

t

tenKe in Data Engineers
Я бы наверн начал с линукса, питоши и SQL’а
источник

t

tenKe in Data Engineers
а там уже сам дальше разберешься)
источник

Б

Борис in Data Engineers
Что то мне кажется вопрос был про джуна в Спарке, а не просто джуна.
источник

AG

Arsen Gumin in Data Engineers
Переслано от Arsen Gumin
Подскажите в экосистеме scala инструменты как airflow, luigi
источник

AG

Arsen Gumin in Data Engineers
Для локальных задач, не Энтерпрайз, не двх. Для пакетной обработки задач
источник

t

tenKe in Data Engineers
на тот случай, если тебе кажется, что я не прочитал вопрос, сообщаю - тебе только кажется
источник

I

Ivan Burmachev in Data Engineers
Всем привет. Можете подсказать(или дать линк на какую-нибудь хорошую статью), как лучше разметить датасет для задачи детектирования объекта на изображении?
источник

ММ

Максим Митяев... in Data Engineers
Можешь погуглить по data labelling tools
источник

I

Ivan Burmachev in Data Engineers
Спасибо
источник

N

Nikita Blagodarnyy in Data Engineers
А чем тебя не устраивает airflow вместе с экосистемой скала? Написал на скале, собрал, запустил в айрплов. Ну или по быдлячьи прям код без сборки толкнул.
Там в айрплов код-то шаблонный, особо питон знать не надо.
источник

.

._. in Data Engineers
У меня уже год опыта есть. Я работал с питоном, линуксом, airflow. Мне бы Спарк
источник

t

tenKe in Data Engineers
тогда все изи - посмотри базовые вещи из Dataframe API - проекции, срезы, соединения, агрегаты, оконные функции, пользовательские функции, работа с файловыми форматами (json, csv, parquet, orc) - и в бой
источник

AG

Arsen Gumin in Data Engineers
Я в академических целях, подбираю боевую задачу для изучения scala
источник

AS

Andrey Smirnov in Data Engineers
можно попробовать этот https://github.com/DataTurks
мы используем для задач nlp
источник

N

Nikita Blagodarnyy in Data Engineers
Планировщик для этого вроде не особо нужен
источник