Size: a a a

2020 September 14

ME

Max Efremov in Data Engineers
если совсем плохо, лучше к чародеям и гадалкам)
источник

AL

Alexandra Lisenok in Data Engineers
Max Efremov
если совсем плохо, лучше к чародеям и гадалкам)
Это хорошо сказано 😂
источник

AL

Alexandra Lisenok in Data Engineers
Nikita Blagodarnyy
Если тренд нестабильный и сезонность мутная, я бы в сторону нейронок смотрел.
🤔 спасибки
источник

N

Nikita Blagodarnyy in Data Engineers
Max Efremov
если совсем плохо, лучше к чародеям и гадалкам)
ну это и есть сатанисты
источник

N

Nikita Blagodarnyy in Data Engineers
Граждане, поясните за лучшие практики управления конфигурациями для спарк джобов. Ну типа где их держать, чтобы не передавать в args() ?
источник

AK

Alex Krash in Data Engineers
Nikita Blagodarnyy
Граждане, поясните за лучшие практики управления конфигурациями для спарк джобов. Ну типа где их держать, чтобы не передавать в args() ?
как вариант, можно положить в resources. но всегда могут быть credentials, которые доступны только из среды исполнения (из хранилища секретов, из FS, куда нет доступа у разработчиков)
источник

DZ

Dmitry Zuev in Data Engineers
application.conf / yaml
источник

N

Nikita Blagodarnyy in Data Engineers
А какой-нибудь приятный микросервис, который читает конфиг из гита и раздает страждущим никто не знает?
источник

N

Nikita Blagodarnyy in Data Engineers
Nikita Blagodarnyy
А какой-нибудь приятный микросервис, который читает конфиг из гита и раздает страждущим никто не знает?
источник

DZ

Dmitry Zuev in Data Engineers
Для стриминга хотите использовать?
источник

K

KrivdaTheTriewe in Data Engineers
Nikita Blagodarnyy
Граждане, поясните за лучшие практики управления конфигурациями для спарк джобов. Ну типа где их держать, чтобы не передавать в args() ?
вам для чего
источник

K

KrivdaTheTriewe in Data Engineers
мы держим в yaml файле все в гит репозитории
источник

K

KrivdaTheTriewe in Data Engineers
(паролей там никаких не хранится)
источник

N

Nikita Blagodarnyy in Data Engineers
Dmitry Zuev
Для стриминга хотите использовать?
для стриминга сейчас jsonnet привернули.
источник

K

KrivdaTheTriewe in Data Engineers
Nikita Blagodarnyy
для стриминга сейчас jsonnet привернули.
и как это добро выглядит?
источник

SS

Sergey Shushkov in Data Engineers
Аналогично, ямл + конф файлы для разных енвов, авторизация через kerberos
источник

T

T in Data Engineers
А кто-нибудь сталкивался с проблемой когда надо писать в места одновременно в hdfs и s3, на пример? Можно ли это как то легко реализовать без cache/persist ?
источник

DZ

Dmitry Zuev in Data Engineers
А чем persist плох?
источник

N

Nikita Blagodarnyy in Data Engineers
KrivdaTheTriewe
вам для чего
Ну как, у джоба есть какие-то параметры-путь в hdfs, креды в базу, url зукиперов и т.п. Их надо как-то передавать. Стендов/окружений всяких до жопы. Вот и хочется какое-то красивое решение, чтобы это не расползалось по ямлам и args-ам
источник

DZ

Dmitry Zuev in Data Engineers
Nikita Blagodarnyy
Ну как, у джоба есть какие-то параметры-путь в hdfs, креды в базу, url зукиперов и т.п. Их надо как-то передавать. Стендов/окружений всяких до жопы. Вот и хочется какое-то красивое решение, чтобы это не расползалось по ямлам и args-ам
Эм эээ
источник