Size: a a a

2021 July 11

C

Combot in Data Engineers
Nokos has been banned! Reason: CAS ban.
источник

D

Dmitry Girichev in Data Engineers
Добрый день, хотелось бы задать пару вопросов по поводу трудоустройства и обучения по специальности.

Вводные -
- 12 лет проработал на должностях системного администратора;
- на последнем месте работы обслуживал Hadoop кластера, увлекся тематикой DE (всегда была интересна тема СУБД и организации хранения данных),  прослушал курс, сменил должность и круг обязанностей;
- по определенным причинам новая должность меня не устроила, проработал пол года, сейчас приступаю к поиску работы.
Умею в спарк, знаю экосистему хадуп, sql, python

Вопросы
Возьмут ли меня с таким опытом на приличную должность, или придется каким-нибудь DE-джуном устраиваться на пол оклада?
Стоит ли предварительно пройти какой-нибудь курс по клауд-ориентированному DE? Я полагаю таких должностей много и будет становится больше и больше с каждым годом, а мой опыт в основном по on-premise
Может кто-нибудь накидает в личку каких-нибудь типовых вопросов на собеседованиях DE?
источник

N

Nikita Blagodarnyy in Data Engineers
лучше в @datajobs
источник

I

Ivoya in Data Engineers
Ребят, не подскажите как в спарк стриминге нормализировать данные?
источник

I

Ivoya in Data Engineers
Что-то вроде standardscale, но не совсем понимаю как это применить можно (и можно ли?)
источник

e

er@essbase.ru in Data Engineers
А можно пример что на входе и что хочешь на выходе?
источник

N

Nikita Blagodarnyy in Data Engineers
Видимо, речь про нормирование, а не про нормализацию?
источник

I

Ivoya in Data Engineers
На входе строка с кучей столбцов и данные каждого столбца в разном диапозоне
источник

I

Ivoya in Data Engineers
Я хочу их в диапазон от 0 до 1
источник

I

Ivoya in Data Engineers
И чтобы это делалось на основе уже собранных данных (чтоб среднее и ст отклонение, например, вычислялись на их основе)
источник

AZ

Anton Zadorozhniy in Data Engineers
вы масштаб заранее знаете в потоке, или это что-то неизвестное?
источник

I

Ivoya in Data Engineers
Есть некоторая выборка уже первоначальная
источник

AZ

Anton Zadorozhniy in Data Engineers
вы можете масштаб джобу как конфигурацию передавать, ну или держать где-то максимум и минимум который видели в потоке и по ним уже нормировать
источник

I

Ivoya in Data Engineers
Нет ли примера такого использования?
источник

I

Ivoya in Data Engineers
Я со спарком на вы
источник

I

Ivoya in Data Engineers
То есть тему с максимумом и минимумом я понял, а вот как конфигурацию - неочевидно
источник

N

Nikita Blagodarnyy in Data Engineers
Прочитайте спарк стриминг программинг гайд
источник

N

Nikita Blagodarnyy in Data Engineers
Там написано как делать агрегаты на стриме
источник

N

Nikita Blagodarnyy in Data Engineers
Вопрос только в том что будет считаться нормой на стриме
источник

N

Nikita Blagodarnyy in Data Engineers
Или она будет постоянно скользящей, или стейт будет бесконечно раздуваться
источник