Size: a a a

2019 November 22

K

KrivdaTheTriewe in Data Engineers
Ещё можно reduceByKey
источник

K

KrivdaTheTriewe in Data Engineers
Или агрегатор по юзеру сделать
источник

K

KrivdaTheTriewe in Data Engineers
Тогда быстро отработает
источник

K

KrivdaTheTriewe in Data Engineers
За один редьюс
источник

EV

Eduard Vlasov in Data Engineers
я вот тоже думал про кастомную UDAF
источник

EV

Eduard Vlasov in Data Engineers
простой фильтр сломается при повторяющихся событиях :(
источник

OP

O. Petr in Data Engineers
Udwf
источник

EV

Eduard Vlasov in Data Engineers
так это же и есть udaf с окном
источник

K

KrivdaTheTriewe in Data Engineers
Eduard Vlasov
простой фильтр сломается при повторяющихся событиях :(
Почему
источник

K

KrivdaTheTriewe in Data Engineers
Вы можете все одним удафом сделать
источник

K

KrivdaTheTriewe in Data Engineers
Вам по сути нужно  агрегировать список событий, время события а, время события б
источник

K

KrivdaTheTriewe in Data Engineers
И обновлять
источник

K

KrivdaTheTriewe in Data Engineers
Ну и ид каждого из событий
источник

K

KrivdaTheTriewe in Data Engineers
Но если у вас не так всего много
источник

K

KrivdaTheTriewe in Data Engineers
То лучше сделайте правильно
источник

K

KrivdaTheTriewe in Data Engineers
И проще логику
источник

EV

Eduard Vlasov in Data Engineers
угу в udaf все без проблем делается, но тяжеловато сопровождать это, а голый sql - медленно :(
источник

EV

Eduard Vlasov in Data Engineers
спасибо 👍
источник

K

KrivdaTheTriewe in Data Engineers
Eduard Vlasov
угу в udaf все без проблем делается, но тяжеловато сопровождать это, а голый sql - медленно :(
Ну нк знаю, чо там
источник

K

KrivdaTheTriewe in Data Engineers
К датасету приведите
источник