Size: a a a

2019 October 31

MH

Mr. Heisenberg in Data Engineers
Max Efremov
А вот эту часть не понял. Нужно к каждой дате применить какую-то трансформацию или что?
Тогда короче вопрос. Я объявил dataframe. Как наполнять его циклом?
источник

ME

Max Efremov in Data Engineers
ммм, ну в принципе можно создать датафрейм из массива)
источник

ME

Max Efremov in Data Engineers
хз, обычно датафрейм я создаю из файликов всяких с hdfs)
источник

I

Igor in Data Engineers
это типа
spark_context.parallelize(zip(["Don't", "do", "drugs"], ["Read", "from", "hdfs"])
?
источник

ME

Max Efremov in Data Engineers
df = spark.createDataFrame(
   [["001", 1], ["001", 901], ["002", 1], ["002", 901]],
   ["model", "second"]
)
если на питоне
источник

ME

Max Efremov in Data Engineers
Но я чисто для локальной отладки трансформаций такое юзаю, если такое в реальной задаче получается, то нужен ли там спарк?
источник

ME

Max Efremov in Data Engineers
Может панды какие-нить или ещё что-то...
источник

N

Nikita Blagodarnyy in Data Engineers
Коллеги, никто вот такого в фениксе не ловил?
источник

N

Nikita Blagodarnyy in Data Engineers
источник

AB

Alexander Batyrshin in Data Engineers
@nblagodarnyy вы с Сашей попробовали конфиги потрогать?
источник

S

Stanislav in Data Engineers
Nikita Blagodarnyy
Коллеги, никто вот такого в фениксе не ловил?
Она очень говорящая, особенно если работал с хбейз апи
источник

DM

David Manukian in Data Engineers
Привет всем, никто не в курсе можно ли в apache beam создать одновременно два KafkaIO.read()? Я хочу что бы у меня одновременно в приложении считывались 2 консюмер группы.
источник
2019 November 01

DY

Dan Y in Data Engineers
кто нибудь делал репорты на основе кассандры/сциллы? нужно рисовать таблицу и по ней графики рисовать немного. pentaho и jasper не работают с кассандрой как оказалось
источник

R

Renarde in Data Engineers
Dan Y
кто нибудь делал репорты на основе кассандры/сциллы? нужно рисовать таблицу и по ней графики рисовать немного. pentaho и jasper не работают с кассандрой как оказалось
Presto для SQLзапросов + Superset для визуализации?
источник

DY

Dan Y in Data Engineers
Renarde
Presto для SQLзапросов + Superset для визуализации?
Да как раз нагуглил суперсет. А zeppelin тут не подойдёт?
источник

AS

Andrey Smirnov in Data Engineers
Dan Y
Да как раз нагуглил суперсет. А zeppelin тут не подойдёт?
там совсем простые графики, тогда уж лучше брать jupyter
источник

DY

Dan Y in Data Engineers
Понял спасибо
источник

s

shaikh in Data Engineers
Hello folk's any one having kafka and spark docs plz share thanks in advance
источник

GP

Grigory Pomadchin in Data Engineers
shaikh
Hello folk's any one having kafka and spark docs plz share thanks in advance
источник

λ

λoλdog in Data Engineers
Зачем ты гуглишь за него
источник