Size: a a a

2020 December 22

SZ

Sergey Zhiganov in Data Engineers
Alex
Насколько помню да, хайв только путь хранит до папки
могу ошибаться но наверно при создании таблицы нужно локацию указать
источник

A

Alex in Data Engineers
Да, я к тому что внутри метадатасервера инфы по файлам нету
источник

A

Alex in Data Engineers
Но не уверен для managed таблиц
источник

Т

Тарас Мойсюк... in Data Engineers
Привет! Если кто-нибудь кто разбирается во Flink SQL? У меня есть continuous join который смотрит на две dynamic таблицы (кафка топики) и проблема в том, что размер чекпойнтов постоянно растет, я думаю, что это связано с тем, что в каждом чекпойнте хранятся записи, прочитанные за все время, хотя в запросе стоит отсечка по таймстемпу. Можно ли как-то еще указать временную отсечку?
источник

M

Mi in Data Engineers
Переслано от Mi
Кто-нибудь знает есть ли способ кастомизировать спарковый partition discovery чтобы на лету решать какие патриции должны быть видны а какие нет?
источник

M

Mi in Data Engineers
Переслано от Mi
Нужно для того чтобы скрыть некоторые патриции которые отвечают за версию данных
источник

ПБ

Повелитель Бури... in Data Engineers
а зачем flink если есть airflow?
источник

A

Alex in Data Engineers
Повелитель Бури
а зачем flink если есть airflow?
зачем база данных если есть питон
источник

A

Alex in Data Engineers
из той же оперы сравнение
источник

T

T in Data Engineers
Ой у меня про партиции тоже есть вопрос, можно ли их как-то из ридера вытащить, на пример заоверавтив пару методов, хочу после записи получить коллекцию партиции которые были созданы
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
зачем база данных если есть питон
зачем питон если есть варан?
источник

AZ

Anton Zadorozhniy in Data Engineers
Mi
Переслано от Mi
Кто-нибудь знает есть ли способ кастомизировать спарковый partition discovery чтобы на лету решать какие патриции должны быть видны а какие нет?
можно попробовать datasourcereader.planinputpartitions посмотреть, но это для вашей реализации datasource, не уверен что можно подключить свою реализацию.. а в базах для такой логики вьюшки обычно используют
источник

DT

Denis Tsvetkov in Data Engineers
/var/run устарел, btw
источник

M

Mi in Data Engineers
Anton Zadorozhniy
можно попробовать datasourcereader.planinputpartitions посмотреть, но это для вашей реализации datasource, не уверен что можно подключить свою реализацию.. а в базах для такой логики вьюшки обычно используют
Буду искать, спасибо
источник

AZ

Anton Zadorozhniy in Data Engineers
Denis Tsvetkov
/var/run устарел, btw
Иппон
источник

Т

Тарас Мойсюк... in Data Engineers
Повелитель Бури
а зачем flink если есть airflow?
нужно низкое latency, на аирфлоу как раз эта джоба уже сделана
источник

TB

Timur Batyrshin in Data Engineers
всем привет, а как сейчас модно запускать Flink на AWS?
из всего стека нужен только он (будет работать в связке с dolphinscheduler).
по прежнему EMR?
источник

ME

Mikhail Epikhin in Data Engineers
Timur Batyrshin
всем привет, а как сейчас модно запускать Flink на AWS?
из всего стека нужен только он (будет работать в связке с dolphinscheduler).
по прежнему EMR?
можно kinesis тогда
источник

ME

Mikhail Epikhin in Data Engineers
источник

TB

Timur Batyrshin in Data Engineers
ага, почитаю, спасибо
источник