Size: a a a

2021 July 09

ЕГ

Евгений Глотов... in Data Engineers
Надо всё тестировать руками, проверять, не поменялись ли объёмы данных, может где-то перестало в память влезать и начало на диск скидываться, может где-то броадкаст перестал пролезать, может сеть тупит, может диск сдох, но при этом через час отвечает, что он живой, и хадуп не выкидывает ноду из кластера
источник

ПФ

Паша Финкельштейн... in Data Engineers
Не-не, ни в коем разе, вся память нативная, никакого оверхеда
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Нашел крутую книгу по спарку, а ей 6 лет (.. искать новее или для базы сойдет?
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Цель - научится выгребать данные для табло из кассандры и чего-то там ещё.
источник

GP

Grigory Pomadchin in Data Engineers
это что за книга такая
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Изучаем спарк. Молниеносный анализ данных.
источник

NN

No Name in Data Engineers
В принципе, для того, чтобы такую задачу решить, книга особо не нужна.
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Spark
источник

SO

Simon Osipov in Data Engineers
Холден скорее всего
источник

SO

Simon Osipov in Data Engineers
Там вторая версия была вроде
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
PySpark сразу?
источник

NN

No Name in Data Engineers
Лучше spark: the definitive guide, если хочется поглубже разобраться, я уже говорил
источник

NN

No Name in Data Engineers
Как удобнее, любое апи, хоть C#, хоть Kotlin
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Да, я записал. Английское после русского хотел читать.
источник

SO

Simon Osipov in Data Engineers
А не, во норм
источник

SO

Simon Osipov in Data Engineers
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
С++ возможен? О_о
источник

NN

No Name in Data Engineers
Нет
источник

SO

Simon Osipov in Data Engineers
Вот эта новая, вторая версия
источник

SO

Simon Osipov in Data Engineers
И конечно же, заглянуть сюда

https://t.me/moscowspark
источник