Size: a a a

2021 April 22

AZ

Anton Zadorozhniy in Data Engineers
вот похожий баг, еще не смерджен даж https://github.com/kubernetes/kubernetes/pull/97101
источник

AZ

Anton Zadorozhniy in Data Engineers
но вообще у меня в аналитикопсе есть отдельный джоб, который ходит смотреть на остальные, он делает клинап, телеметрию дополнительную собирает, может алерт поднять, мб он убивает джобы которые превысили дедлайн, надо глянуть в код
источник

P

Pavel in Data Engineers
вот это у нас в бэклоге. похоже, придется приоритет повысить)
источник

AZ

Anton Zadorozhniy in Data Engineers
могу только сказать что если вы прям очень много джобов хотите запускать, и кластеров много, то лучше внешний инструмент использовать, а не эту поделку в кубере... например вот https://github.com/G-Research/armada/
источник

P

Pavel in Data Engineers
джобов поднимается относительно не много, но относительно часто, каждую минуту от 10 до 30
источник

P

Pavel in Data Engineers
кластер один всего
источник

P

Pavel in Data Engineers
ETL наш запускает джобы
источник

ME

Max Efremov in Data Engineers
Оказалось, что вот такая команда доходит до скрипта в урезанном виде, все двойные скобочки удаляются... Т.е. }}} на конце превращается в } и убивает json...
источник

AZ

Anton Zadorozhniy in Data Engineers
а, ну тогда наверное с родными проще, армада хороша если надо по очередям делить, и их очень много (тысячи-миллионы)
источник

P

Pavel in Data Engineers
типа того, оверкил будет
источник

AZ

Anton Zadorozhniy in Data Engineers
я делал дему где мы автоматически переобучали 50+ тыс моделей (в кубере, а не в базе), было прикольно)
источник

e

er@essbase.ru in Data Engineers
Преподаешь ?
источник

GP

Grigory Pomadchin in Data Engineers
нет, не моя таймзона)
разъяснил слегка пост)
источник

K

KrivdaTheTriewe in Data Engineers
Расскажите
источник

AZ

Anton Zadorozhniy in Data Engineers
Не могу пока
источник

AZ

Anton Zadorozhniy in Data Engineers
Вы тут вроде любите такие картинки https://link.medium.com/nXm5IDnDFfb
источник
2021 April 23

T

T in Data Engineers
Привет чат, а какая альтернатива для spark.sql.legacy.allowCreatingManagedTableUsingNonemptyLocation в 3 спарке для saveAsTable . Самому фаилы потереть перед записью? mode overwrite не помогает.
источник

ЕГ

Евгений Глотов... in Data Engineers
А чё, так можно было?
Сталкивался несколько раз с проблемой, что если спарк начал записывать табличку, а потом вырубили, то второй раз уже не запишется, так как таблицы нет, а путь забит
источник

ЕГ

Евгений Глотов... in Data Engineers
Удалять руками конечно помогает, а чем плох параметр?
источник

T

T in Data Engineers
Тем что его выпили из 3 спарка
источник