Size: a a a

2020 December 18

A

Alex in Data Engineers
смотря что вы под макулатурой подразумеваете
источник

A

Alex in Data Engineers
источник

A

Alex in Data Engineers
в бранчах пусто у них
а вот в tags всё что нужно есть
источник

SS

Sergey Sheremeta in Data Engineers
оу-оу! спасибо, добрый человек! в теги-то и не смотрел
источник

AZ

Anton Zadorozhniy in Data Engineers
Roman
А ещё нужно учитывать версии orc и паркета и версии ридеров у джижков. Потому что фраза "сравнить pdo в orc и parquet" разворачивается а "сравнить эффективность pdo в ряде случаев на разных набора данных, а также при различнлм размазывании этих данных, с разными ключевыми версиями orc и parquet на разных ключевых версиях основных популярных фреймворках"
Это я все к тому, что это достаточно большое задание на самом деле.
на курсовую в семестре вполне тянет, в этом и поинт
источник

R

Runtime Еггор in Data Engineers
Товарищи, есть две таблички в спарке 2.4, хочется заджойнить первую с каждой из колонок во второй и потом сделать юнион всего этого всего.
Я сделал:
tab1.columns.map(column => tab2.join(tab1, $”col” === column)).reduce(_.union(_))
Но мне выдало нули. Обычный джойн работал ($”col” === $”col”).
Не подскажете, в чём может крыться причина?
источник

AL

Anton Lashin in Data Engineers
потому что в условии джойна идет сравнение значения колонки со строкой: tab1.columns - это массив строк, и поэтому условие $"col" === column превращается в невалидное по сути
источник

R

Runtime Еггор in Data Engineers
Окей, а как это лучше всего исправить? Возможно, какую-то логику подскажете?)
источник

R

Runtime Еггор in Data Engineers
Я просто новичок и не шарю(
источник

N

Nikita Blagodarnyy in Data Engineers
а что вообще значит «заджойнить таблицу с каждой из колонок во второй»?
источник

AL

Anton Lashin in Data Engineers
Nikita Blagodarnyy
а что вообще значит «заджойнить таблицу с каждой из колонок во второй»?
скорее, зачем
источник

N

Nikita Blagodarnyy in Data Engineers
Можете на sql аналог нарисовать?
источник

R

Runtime Еггор in Data Engineers
Ну tab1 это результаты предсказания разных алгоритмов (айдишники), в tab2 есть для них какие-то характеристики для каждого айдишника, я хочу померять их по каждому алгоритму
источник

T

T in Data Engineers
Runtime Еггор
Товарищи, есть две таблички в спарке 2.4, хочется заджойнить первую с каждой из колонок во второй и потом сделать юнион всего этого всего.
Я сделал:
tab1.columns.map(column => tab2.join(tab1, $”col” === column)).reduce(_.union(_))
Но мне выдало нули. Обычный джойн работал ($”col” === $”col”).
Не подскажете, в чём может крыться причина?
если без разбирательства зачем, то вам column над просто в колонку превратить на пример с помощью col(column). Но вобще зачем это хороший вопрос конечно
источник

N

Nikita Blagodarnyy in Data Engineers
это типа
select * from t1 join t2 on t1.col=t2.col1 union all select * from t1 join t2 on t1.col = t2.col2
так что ли?
источник

R

Runtime Еггор in Data Engineers
Так и есть
источник

N

Nikita Blagodarnyy in Data Engineers
может проще второй unpivot сделать?
источник

R

Runtime Еггор in Data Engineers
Я погуглю, что это, спасибо большое!
источник

N

Nikita Blagodarnyy in Data Engineers
«превращение колонок в строки»
источник

KS

K S in Data Engineers
Какое железо лучше подойдет для масштабирования Presto? Запросы уже по 24 часа тянутся...
источник