Size: a a a

2019 November 05

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
он просто пишет от своей практики: нарывается на проблему - ковыряет внутренности - описывает что нарыл
Да понятное дело, я и до них доберусь, сейчас сделал обзорные слайды по спарк rdd
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Да понятное дело, я и до них доберусь, сейчас сделал обзорные слайды по спарк rdd
самое время!)
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
самое время!)
Ну дальше датафреймы
источник

K

KrivdaTheTriewe in Data Engineers
Рдд все таки основа
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Рдд все таки основа
а кто аудитория, дата инженеры?
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
а кто аудитория, дата инженеры?
Студенты
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Студенты
а, тогда да
источник

AZ

Anton Zadorozhniy in Data Engineers
в работе есть несколько тем которые всегда пользуются популярностью, например "я сатанист на занятом кластере, как мне удостовериться что все разрешенные мне ресурсы используются моим спарк джобом" - про мемори модель ярна и спарка и как их настраивать, в таком духе
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
в работе есть несколько тем которые всегда пользуются популярностью, например "я сатанист на занятом кластере, как мне удостовериться что все разрешенные мне ресурсы используются моим спарк джобом" - про мемори модель ярна и спарка и как их настраивать, в таком духе
Если бы сатанистам , то да , про датпфреймам обзорный курс и так далее
источник

IG

Ivan Gagarkin in Data Engineers
Anton Zadorozhniy
по внутренностям спарка проще всего взять материалы Яцека, у него с пробелами но зато очень глубоко
Извините. Кто такой? Чем знаменит?
Что вообще есть хорошего на русском по хадупу/ спарку в русском мире кроме курса от майл.ру?
источник

GP

Grigory Pomadchin in Data Engineers
Ivan Gagarkin
Извините. Кто такой? Чем знаменит?
Что вообще есть хорошего на русском по хадупу/ спарку в русском мире кроме курса от майл.ру?
источник

GP

Grigory Pomadchin in Data Engineers
суровый спарк энтузиаст, его материалы должны быть официальными доками и рекомендациями спарка
источник

IG

Ivan Gagarkin in Data Engineers
Спасибо
источник

TT

Tsh Tsh in Data Engineers
Grigory Pomadchin
суровый спарк энтузиаст, его материалы должны быть официальными доками и рекомендациями спарка
Кстати он в основном зарабатывает на тренингах, курсах обучения. Обычно курс 1-2  недели спарка с кафкой,
Майл, Мегафон, сбер и т.п.
источник

TT

Tsh Tsh in Data Engineers
Могут его пригласить за денежку спокойно
источник
2019 November 06

神風 in Data Engineers
tenKe
сравниваешь numInputRows с maxOffsetsPerTrigger
А если я неправильно выбрал второе?
источник

神風 in Data Engineers
Или ситуация поменялась, поток вырос
источник

t

tenKe in Data Engineers
то его можно поменять, они не прибивается гвоздями при создании чекпоинта
источник

神風 in Data Engineers
tenKe
то его можно поменять, они не прибивается гвоздями при создании чекпоинта
Да, но я должен где-то вывесить красную тряпку "лаг растёт, опомнись"
источник

t

tenKe in Data Engineers
ну у тебя все равно будет видно - если у тебя постоянно numInputRows == maxOffsetsPerTrigger - то твой стрим лагает
источник