Size: a a a

2021 October 27

RK

Ruslan Krivoshein in Data Engineers
Столкнулся с проблемой.
В Airflow (и перед, и после дага пробовал) объявляю переменную с текущим таймштампом и далее сую в два последовательных оператора. Внутри оператора значения разные. В чём причина может быть и как сделать одинаковое значение для всех операторов дага?
источник

NN

No Name in Data Engineers
Мб потому что он их инициализирует каждый раз, и это не одновременно?
источник

VP

Vitaly Pismarev in Data Engineers
источник

RK

Ruslan Krivoshein in Data Engineers
Выглядит так, да. Но в моей голове не укладывается)
источник

RK

Ruslan Krivoshein in Data Engineers
Спасибо!
источник

AS

Andrey Smirnov in Data Engineers
был доклад одноклассников, у них больше сотни петабайт в ванильном хадупе.
кстати как я понял они слезли с друида на кликхаус, и там сотни терабайт
источник

A

Alex in Data Engineers
а может вспомните где этот доклад был?
источник

NB

Nikita Bakanchev in Data Engineers
Если не видел, то на смартдате был доклад Николая Голова про сноуфлейк в том числе с описанием костов
источник

A

Alex in Data Engineers
ну и про ванильный зная как они перепатчивали кассандру я бы не говорил =)
может там был ванильный на старте, но потом понеслось
источник

ИК

Иван Калининский... in Data Engineers
доклад на последней смартдате у них был про Erasure Encodings и связанную с этим порчу файлов при восстановлении
источник

A

Alex in Data Engineers
эх....
источник

BT

Boris Tyshkevich in Data Engineers
тогда непонятно почему в вашем списке нет кх на баре металл.  Дешевле не бывает.
источник

AZ

Anton Zadorozhniy in Data Engineers
КХ немножко про другое
источник

BT

Boris Tyshkevich in Data Engineers
автор пока не сказал про что.  только про хранение занедорого для дижитал маркетинга.
источник

VP

Vitaly Pismarev in Data Engineers
Не, это у нас BQ для диджитала сейчас, одной из песочниц.  А весь набор источником самый разный. Это и тики от биржевых провайдеров, и трейды и всякие кликстимы и данные из продуктовых баз... Подозреваю я много ещё не знаю

Кх есть уже в ландашвте, но он больше для конечных витрин а не для ресерча + у него специфический SQL и аналитикам он неудобен. Ну и в обслуживании он, как бы это сказать, не так прост ))

А хочется нормальных джойнов, SQL аля вертика или BQ и желательно всё это в облаке чтобы с минимумом администрирования и с хорошей масштабируемостью
источник

AZ

Anton Zadorozhniy in Data Engineers
firebolt еще гляньте
источник

AZ

Anton Zadorozhniy in Data Engineers
а чорт, нет, они не выкатились еще на GCP
источник

VP

Vitaly Pismarev in Data Engineers
На самом деле это не препятствие ) У нас в AWS основные сервисы. Про firebolt читал и слышал, если руки дойдут по попробуем. Пилотов многовато намеается )
источник

AZ

Anton Zadorozhniy in Data Engineers
они голодные, по деньгам может хорошо получиться)
источник

VP

Vitaly Pismarev in Data Engineers
Ну значит попробуем больше пилотов ) Спс за наводку
источник