Size: a a a

2021 November 03

AK

Alex K in Data Engineers
А от скольки в паймпарк
источник

ЕГ

Евгений Глотов... in Data Engineers
Да нафиг не нужен тот бустинг, он фуфло
источник

AK

Alex K in Data Engineers
Аа
источник

AK

Alex K in Data Engineers
Ясно
источник

ЕГ

Евгений Глотов... in Data Engineers
Если там сотни миллионов и прям сильно день заморачиваться, то можно его
источник

AK

Alex K in Data Engineers
аа, ясноъ
источник

AK

Alex K in Data Engineers
спасибо!
источник

AZ

Anton Zadorozhniy in Data Engineers
все в питоне сделать, забудьте про спарк
источник

T

T in Data Engineers
+++
источник

AK

Alex K in Data Engineers
Получается spark тип для extract юзают только
источник

AK

Alex K in Data Engineers
Уже неделю провозился)
источник

AZ

Anton Zadorozhniy in Data Engineers
для дата инжиниринга (чатик так называется), и тоже только для крупных объемов; преимущество спарка только в масштабируемости, так-то он тормозной и неудобный
источник

T

T in Data Engineers
Ты распиши задачу целиком может тебе он совсем не нужен
источник

AK

Alex K in Data Engineers
Ясна
источник

AK

Alex K in Data Engineers
Попозжа напишу!
источник

ЕГ

Евгений Глотов... in Data Engineers
Удобный, как раз чтобы засунуть модельку в юдф, например)
источник

ЕГ

Евгений Глотов... in Data Engineers
На чём-либо другом бесплатном это сильно более стрёмно выглядит или вообще не поддерживается
источник

kk

k k in Data Engineers
Ребят, вопрос, я на cron запустил скрипт питон и все сработало...

А как теперь на cron запустить команду, которая должна запускаться из определенной директории ..?
источник

AZ

Anton Zadorozhniy in Data Engineers
можно написать шелл скрипт который будет идти в нужную директорию, и потом запускать там скрипт
источник

T

Tishka17 in Data Engineers
Выкинуть крон, взять systemd timer и там есть куча опций для настройки. В качестве бонуса сможет нормально логи читать через journalctl
источник