Size: a a a

2019 November 01

АЖ

Андрей Жуков in Data Engineers
хадуп точно поверх цефа у них
источник

АЖ

Андрей Жуков in Data Engineers
может, и кубики тоже
источник

E

Eugene in Data Engineers
Ещё момент. Чем больше слоев абстракции, тем больше шансов воткнуться в кривые руки разрабов, которые их писали. Придется контрибьютить.
источник

AS

Anton Shelin in Data Engineers
Vitaly Petrov
Привет!
Кто-нибудь может подсказать, как ускорить заливку данных из pyspark-овского датафрейма в Postgre-SQL базу? Сейчас льется примерно три часа, для сравнения, тот же датафрейм, но в Хайв, заливается за ~12 минут. Использую jbdc-postgre драйвер
Можно попробовать .option("numPartitions", parallelismLevel) уменьшить уровень параллелизма или если никак то можно попробовать руками через pyodbc
источник

P

Pavel in Data Engineers
Eugene
Афинити на эту ошибку мало влияет. Только если железо разное. И постоянное схлопывание сервисов.
nfs маунтится только на одну ноду куба. это избавило от случайной ошибки Input/Output
источник

E

Eugene in Data Engineers
Pavel
nfs маунтится только на одну ноду куба. это избавило от случайной ошибки Input/Output
Но она, по-прежнему, выскакивает, так?
источник

P

Pavel in Data Engineers
Eugene
Но она, по-прежнему, выскакивает, так?
после того, как прибили запуск на одну ноду, то перестало
источник
2019 November 03

AN

Alibek Nurpeissov in Data Engineers
Всем привет, хотел спросит как правильно настроить спарк чтоб в мезос-е он отображался?
источник

AN

Alibek Nurpeissov in Data Engineers
источник

AN

Alibek Nurpeissov in Data Engineers
источник

AN

Alibek Nurpeissov in Data Engineers
Извини за такой вопрос) я новичок)
источник

AN

Alibek Nurpeissov in Data Engineers
Я через амбари настраиваю спарк, как я понял надо дописать в spark2-env.sh??
источник

AN

Alibek Nurpeissov in Data Engineers
источник

A

AM in Data Engineers
Привет! А вакансии здесь можно постить?
источник

ЕГ

Евгений Глотов in Data Engineers
AM
Привет! А вакансии здесь можно постить?
В описание чата загляните
источник

A

AM in Data Engineers
Евгений Глотов
В описание чата загляните
Спасибо!
источник
2019 November 04

C

Combot in Data Engineers
Jonathan Pratono has been banned! Reason: CAS ban.
источник

C

Combot in Data Engineers
troncity.io has been banned! Reason: CAS ban.
источник

神風 in Data Engineers
Добрый вечер. Не подскажете как лучше мониторить лаг при использовании spark structured streaming?
источник
2019 November 05

ME

Max Efremov in Data Engineers
А у него в spark UI нет такой метрики?
источник