Size: a a a

2019 November 05

ME

Max Efremov in Data Engineers
Там что-то явно должно быть для этого. К сожалению мониторил сам только батчи(
источник

神風 in Data Engineers
Не нашёл.
источник

N

Nika in Data Engineers
Udf спарка это udf хайва ? Можно же udtf свою запихнуть ?
источник

t

tenKe in Data Engineers
神風
Добрый вечер. Не подскажете как лучше мониторить лаг при использовании spark structured streaming?
что конкретно ты подразумеваешь под лагом?
источник

神風 in Data Engineers
tenKe
что конкретно ты подразумеваешь под лагом?
Разница между оффсетом последней записи  и максимальным оффсетом  текущей прочитанной в батче.
источник

AC

Alexander Chermenin in Data Engineers
можно просто глянуть по consumer-группе?
источник

神風 in Data Engineers
Для этого достаточно знать текущие максимальные  офсеты по партициям. Можно конечно взгромоздить консумер с записью вникуда
источник

神風 in Data Engineers
Интересует элегантное решение. Если оно есть...
источник

神風 in Data Engineers
Alexander Chermenin
можно просто глянуть по consumer-группе?
Из спарк джоба?
источник

AC

Alexander Chermenin in Data Engineers
из консоли) вам постоянно лаг мониторить нужно?
источник

神風 in Data Engineers
Alexander Chermenin
из консоли) вам постоянно лаг мониторить нужно?
Не, консоль не рулит..
источник

t

tenKe in Data Engineers
神風
Для этого достаточно знать текущие максимальные  офсеты по партициям. Можно конечно взгромоздить консумер с записью вникуда
streamingQuery.lastProgress
источник

神風 in Data Engineers
tenKe
streamingQuery.lastProgress
Взял event.progress.json()
источник

神風 in Data Engineers
Только там нет этой инфы. Есть офсеты батча начало-конец по каждой партиции
источник

t

tenKe in Data Engineers
ну а дальше ты из кафки вынимаешь  оффсеты топика
источник

神風 in Data Engineers
tenKe
ну а дальше ты из кафки вынимаешь  оффсеты топика
Воооот... Очем я и говорю, вешаю пустой консумер для вычитки последнего офсета...
источник

神風 in Data Engineers
Только так?
источник

t

tenKe in Data Engineers
да, тк спарк как обычный косумер ниче не знает про последние оффсеты
источник

t

tenKe in Data Engineers
но вообще есть метод гораздо более простой (если тебе надо качественно понять, есть лаг или нет)
источник

神風 in Data Engineers
?
источник