Size: a a a

2020 September 14

АЖ

Андрей Жуков... in Data Engineers
Если на серваках в итоге будет а-ля редхат,  может стать весело.
источник

АЖ

Андрей Жуков... in Data Engineers
Но тоже жить можно
источник

AZ

Anton Zadorozhniy in Data Engineers
я вот месяц живу на Windows + WSL2 (ubuntu lts), кроме локальных врожденных юзабилити проблем винды - полет нормальный
источник

АЖ

Андрей Жуков... in Data Engineers
Anton Zadorozhniy
я вот месяц живу на Windows + WSL2 (ubuntu lts), кроме локальных врожденных юзабилити проблем винды - полет нормальный
Ну энто да,  всегда есть и докер, и виртуалки, и wsl хоть со вкусом федоры
источник

AZ

Anton Zadorozhniy in Data Engineers
Андрей Жуков
Ну энто да,  всегда есть и докер, и виртуалки, и wsl хоть со вкусом федоры
и эксель, прям из коробки)
источник

АЖ

Андрей Жуков... in Data Engineers
Anton Zadorozhniy
и эксель, прям из коробки)
Ну не совсем из коробки,  еще ж лицуха нужна!
источник

AZ

Anton Zadorozhniy in Data Engineers
Андрей Жуков
Ну не совсем из коробки,  еще ж лицуха нужна!
настоящий дата инженер сможет себе позволить)
источник

N

Nikita Blagodarnyy in Data Engineers
Андрей Жуков
Если на серваках в итоге будет а-ля редхат,  может стать весело.
а почему? что не так с редхатом? кучу инсталляций видел на сентосе и редхате.
источник

АЖ

Андрей Жуков... in Data Engineers
Nikita Blagodarnyy
а почему? что не так с редхатом? кучу инсталляций видел на сентосе и редхате.
с самим редхатом проблем нет, просто можно с системными зависимостями подорваться
источник

T

T in Data Engineers
Привет, можете поделится годной статьей про костомизацию плана запросов в спарке. Мне интересно как его правильно распараллелить
источник

MA

Mark Andreev in Data Engineers
Kirill Bazarov
Всем привет. Подскажите пожалуйста, как мне задеплоить тестовый проект с помощью google cloud functions? У меня будет страница index.html с одной формой для загрузки изображения. После загрузки она будет запускать python-скрипт. Подскажите пожалуйста, как это реализовать?
Я разобрался с тем, как создать cloud function с python-скриптом. По умолчанию сейчас загружается он. Но как сделать так, чтобы по умолчанию загружалась html-ka которая бы вызывала пайтон скрипт необходимости? Где лучше хранить фронт и как он должен взаимодействовать с cloud функцией?
Я бы реализовал это следующим образом:

1. Раздавать статику лучше через Google Storage (G аналог S3). Нужно смотреть в сторону how to serve static site.
2. Дальше я бы поставил Gateway с прямой загрузкой в storage, либо через cloud function. Тут нужно аккуратно с правами, чтоб чужие не залили лишнего. Нужно смотреть в сторону fire base auth, gcp cognito analog.
3. Можно подписаться на появление файлов в хранилище, по этому триггеру запускать cloud function с полезной нагрузкой
источник

A

Artem in Data Engineers
T
Привет, можете поделится годной статьей про костомизацию плана запросов в спарке. Мне интересно как его правильно распараллелить
Такого не встречал, но у stanford'а есть хороший курс от Matei Zaharia (CS245 Principles of Data-Intensive Systems). Там есть лекция по оптимизации плана и домашка к ней - http://web.stanford.edu/class/cs245/slides/07-Query-Optimization-p1.pdf http://web.stanford.edu/class/cs245/assignments/assignment2.pdf
источник

AL

Alexandra Lisenok in Data Engineers
Ребят, привет. Подскажите, кто-нибудь сталкивался с прогнозированием временных рядов с нестабильным трендом (рост в исторических данных с падением в прогнозном периоде) и непостоянной сезонностью (как во времени так и в масштабе)? Какие методы, модели есть, в какую сторону лучше копать? Может есть  ссылки на статьи/проекты?
Буду рада помощи🤞
источник

T

T in Data Engineers
Artem
Такого не встречал, но у stanford'а есть хороший курс от Matei Zaharia (CS245 Principles of Data-Intensive Systems). Там есть лекция по оптимизации плана и домашка к ней - http://web.stanford.edu/class/cs245/slides/07-Query-Optimization-p1.pdf http://web.stanford.edu/class/cs245/assignments/assignment2.pdf
о супер! погляжу, большое спасибо
источник

R

Renarde in Data Engineers
Alexandra Lisenok
Ребят, привет. Подскажите, кто-нибудь сталкивался с прогнозированием временных рядов с нестабильным трендом (рост в исторических данных с падением в прогнозном периоде) и непостоянной сезонностью (как во времени так и в масштабе)? Какие методы, модели есть, в какую сторону лучше копать? Может есть  ссылки на статьи/проекты?
Буду рада помощи🤞
от Facebook есть prophet, там под капотом ARIMA с вероятностной моделью - https://facebook.github.io/prophet/
источник

ME

Max Efremov in Data Engineers
Alexandra Lisenok
Ребят, привет. Подскажите, кто-нибудь сталкивался с прогнозированием временных рядов с нестабильным трендом (рост в исторических данных с падением в прогнозном периоде) и непостоянной сезонностью (как во времени так и в масштабе)? Какие методы, модели есть, в какую сторону лучше копать? Может есть  ссылки на статьи/проекты?
Буду рада помощи🤞
источник

ME

Max Efremov in Data Engineers
Правда это сервис закрытый, но всё равно
источник

AL

Alexandra Lisenok in Data Engineers
Спасибо вам всем😍 очень приятно что вы такие отзывчивые люди!
источник

N

Nikita Blagodarnyy in Data Engineers
Если тренд нестабильный и сезонность мутная, я бы в сторону нейронок смотрел.
источник

N

Nikita Blagodarnyy in Data Engineers
Так нас учили, не знаю, насколько на практике подтверждается.
источник