Size: a a a

2020 October 13

N

Nikita Blagodarnyy in Data Engineers
Похоже бан назрел.
источник

АЖ

Андрей Жуков... in Data Engineers
Uncel Duk
надо его внутри продать
нинада
источник

UD

Uncel Duk in Data Engineers
чому?
источник

UD

Uncel Duk in Data Engineers
udf на udf udf-ом погоняет
источник

UD

Uncel Duk in Data Engineers
источник

AS

Andrey Smirnov in Data Engineers
Alexey Evdokimov
сказал бы мне кто три года тому, во что я ввязываюсь, подумал бы ещё, стоит ли :)
наоборот интереснее, я когда LSH спарковский ускорил в 30 раз был жутко доволен собой, всё лучше перекладывания из одного места в другой
источник
2020 October 14

R

Rodion in Data Engineers
Всем привет, а по какой причине я могу получать пустой результат на такой запрос
SELECT *
FROM table
where part_ts = 1597835585
такое значение есть, проверял на парочке других значений, результат не изменился
источник

DZ

Dmitry Zuev in Data Engineers
Explain в студию
источник

SS

Sergey Shushkov in Data Engineers
Надо больше контекста, может там каст какой хитрый получается, если колонка как строка лежит к примеру.
источник

SO

Simon Osipov in Data Engineers
Вот тебе и питон для бигдаты...
источник

ME

Max Efremov in Data Engineers
никаких больше пайспарк стримов с кафкой?
источник

ME

Mikhail Epikhin in Data Engineers
я писал на pyspark с кафкой, все ок
источник

ME

Mikhail Epikhin in Data Engineers
они там так пишут конечно и поддержка python такая себе
источник

ME

Mikhail Epikhin in Data Engineers
но все работает
источник

OI

Oleg Ilinsky in Data Engineers
Simon Osipov
Вот тебе и питон для бигдаты...
у меня в кубах pyspark в cluster mode так и не взлетел, пришлось на скалу переписывать
а стримы, да, на скале все
источник

ME

Mikhail Epikhin in Data Engineers
Oleg Ilinsky
у меня в кубах pyspark в cluster mode так и не взлетел, пришлось на скалу переписывать
а стримы, да, на скале все
а можно подробней, что именно не взлетело?
источник

OI

Oleg Ilinsky in Data Engineers
Mikhail Epikhin
а можно подробней, что именно не взлетело?
ну он тупо не видил исполняемые файлы и всякие дополнительные джисоны и py библиотеки. Хотя они лежали в tmp директории поднятого spark driver пода.
А со скалой просто указываешь джарник, в котором всё нужное есть и нормально всё резолвится.
источник

ME

Mikhail Epikhin in Data Engineers
и какой версией пользовались? 0.8 или 0.10?
источник

OI

Oleg Ilinsky in Data Engineers
так это не стримы, это был обычный спарк)
источник

ME

Mikhail Epikhin in Data Engineers
Oleg Ilinsky
ну он тупо не видил исполняемые файлы и всякие дополнительные джисоны и py библиотеки. Хотя они лежали в tmp директории поднятого spark driver пода.
А со скалой просто указываешь джарник, в котором всё нужное есть и нормально всё резолвится.
хм, я просто так же джарник указал и все норм
источник