Size: a a a

2021 April 09

OI

Oleg Ilinsky in Data Engineers
источник

Y

Ya Anna in Data Engineers
Это кто?)
источник

Y

Ya Anna in Data Engineers
Спасибо
источник

OI

Oleg Ilinsky in Data Engineers
это группа про работу) вопрос больше подходит под тему того канала)
источник

N

Nikita Blagodarnyy in Data Engineers
Причем здесь трифт? Трифт-сервер это рядом стоящий и довольно валкий демон, который способен запустить спарк джобу без явного сабмита, по jdbc. Но все данные-то он в памяти не держит и пойдет их читать откуда-то из hdfs/s3/csv чтобы вернуть результат.
Что вообще значит фраза «данные лежали в спарке»?
источник

AZ

Anton Zadorozhniy in Data Engineers
тссс, было интересно куда это заведет участников дискуссии
источник

N

Nikita Blagodarnyy in Data Engineers
я просто тоже хочу данные в спарке хранить, достал hdfs.
источник

AZ

Anton Zadorozhniy in Data Engineers
храните в памяти, это точно лучше, тут говорят
источник

SK

Stas Khomutskikh in Data Engineers
коллеги,а с таким никто не сталкивался?
источник

UR

Uncle Ruckus in Data Engineers
Я не знаю куда он пойдет читать, если у меня уже есть сформированный фрейм, обьявленный как временная таблица
источник

UR

Uncle Ruckus in Data Engineers
да не будет никакой дискуссии. У меня это работало и работало хорошо. До тех пор, пока, как справедливо написали, глючний фрифи с очередным релизом перестал работать как надо
источник

UR

Uncle Ruckus in Data Engineers
мдас... ну вы понели
источник

AZ

Anton Zadorozhniy in Data Engineers
вы хранили данные в датафреймах в спарк контексте который запущен через Thrift Server, правильно я понял?
источник

ЕГ

Евгений Глотов... in Data Engineers
Партишен бай айди - это очень фиговая тема
источник

ЕГ

Евгений Глотов... in Data Engineers
А вот бакетирование норм работает
источник

OI

Oleg Ilinsky in Data Engineers
там был id проекта, а не юзера)
источник

А

Алексей in Data Engineers
посмотрел в своем метасторе, есть таблица, которая хранит названия колонок для бакетирования, самих значений как с партициями там нет. Вероятно хэш бакета определятся на лету при обращении по колонке с бакетом
источник

UR

Uncle Ruckus in Data Engineers
там даже еще жестче было, у меня это было одним скомпиленным джарником со вкомпиленным всем, но неважно, суть да, такая
источник

ЕГ

Евгений Глотов... in Data Engineers
Смотря сколько проектов😆
источник

AZ

Anton Zadorozhniy in Data Engineers
и сколько concurrent users на эти данные ходили?
источник