Size: a a a

2021 November 01

t

tenKe in Data Engineers
Коннекторы к статике и стримам
Кишочки датафреймов
Нативные УДФки
Обычные скала удфки дип дайв
Асинхронные экшены
Всякая грязь про управление количеством воркеров
Как юзать py4j в спарке

в кратце так
источник

kk

k k in Data Engineers
Ребят, что делать если нашел достоверную инструкцию , как установить airflow, и реально она сработала без ошибок, однако

Когда хочу запустить дагу в airflow, то получаю ошибку ..

Вопрос: как это заранее предугадать ?? Как сразу найти инструкцию по установке и запуску дага без ошибок ??
источник

K

KrivdaTheTriewe in Data Engineers
на реп похоже
источник

N

Nikita Blagodarnyy in Data Engineers
ну там нету коллекта, но другие экшоны не падают. в поркет пишется например прекрасно.
источник

N

Nikita Blagodarnyy in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
это что за спарк такой
источник

GP

Grigory Pomadchin in Data Engineers
2.4.6?
источник

K

KrivdaTheTriewe in Data Engineers
можно попробовать схему сделать
источник

GP

Grigory Pomadchin in Data Engineers
эх и забыл что там это еще было экспериментал
источник

K

KrivdaTheTriewe in Data Engineers
as[KEKE].schema
источник

GP

Grigory Pomadchin in Data Engineers
и сравнить
источник

GP

Grigory Pomadchin in Data Engineers
хорошая идея
источник

N

Nikita Blagodarnyy in Data Engineers
2.4.5 на 2.11
источник

N

Nikita Blagodarnyy in Data Engineers
так он уже на .as NPE кинет
источник

GP

Grigory Pomadchin in Data Engineers
ExpressionEncoder[KEKE].schema
источник

kk

k k in Data Engineers
..
источник

DZ

Dmitry Zuev in Data Engineers
Никак, это ДЕ
источник

ET

E T in Data Engineers
ребят, всем привет!
Есть ли какой-то стайл гайд по оформлению проектов на пайспарке ?
* Является ли нормой то, что я пишу по 3 +связанные chain трансформации?)
* Как модульно всё красиво оформлять, чтобы было код читался? у меня несколько супер больших csvшников,  кототорые я обрабатываю спарком. Может быть пример есть какой-то общий.
* Норм ли практика писать сначала в ноутбуке и смотреть результаты работы каждой квэри и тд и потом переносить всё в  ide?
источник
2021 November 02

DJ

Damir Junussov in Data Engineers
Всем привет! Что здесь используется в качестве разделителя? Можете подсказать? (CSV File)
источник

ТК

Тарас Кондратюк... in Data Engineers
открой блокнотом и глянь
источник