Size: a a a

2020 July 28

GP

Grigory Pomadchin in Data Engineers
‘мах ресурс алокейшн’ можно и без этого флага добиться; вообще не факт что всем нужен флаг; он форсит паралелизм и колво спу на контейнеры; опасный флаг так то
источник

A

Alex in Data Engineers
так как правильно поступить для распаралеливания считывания нескольких файлов в один датафрейм?
источник

AZ

Anton Zadorozhniy in Data Engineers
Grigory Pomadchin
‘мах ресурс алокейшн’ можно и без этого флага добиться; вообще не факт что всем нужен флаг; он форсит паралелизм и колво спу на контейнеры; опасный флаг так то
Для быстрого «кластер для одного джоба», без погружения в детали - очень даже подходит
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
так как правильно поступить для распаралеливания считывания нескольких файлов в один датафрейм?
Надо посмотреть сколько экзекьюторов, и самое простое - увеличивать их число
источник

A

Alex in Data Engineers
тоесть раздуть кластер и дальше использовать подход с spark.read.csv ?
источник

AZ

Anton Zadorozhniy in Data Engineers
Если у вас кластер только для этого джоба - поднимите тот флаг что я советовал, он все сделает за вас
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
тоесть раздуть кластер и дальше использовать подход с spark.read.csv ?
Сначала убедиться что весь кластер используется, и потом увеличивать его размер
источник

A

Alex in Data Engineers
понял, спасибо!
источник

A

Alex in Data Engineers
да, и чья это настройка , Спарка ?  maximizeResourceAllocation
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
да, и чья это настройка , Спарка ?  maximizeResourceAllocation
EMR Spark
источник

H

Hleb in Data Engineers
Emr
источник

A

Alex in Data Engineers
спасибо
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

A

Alex in Data Engineers
принял, спасибо! буду учить матчасть
источник
2020 July 29

N

Nikita Blagodarnyy in Data Engineers
JB вон свой жупителин запилил

https://datalore.jetbrains.com/
источник

AD

Albus Dumbledore in Data Engineers
Вместо Jupiter NB?
источник

AE

Alexey Evdokimov in Data Engineers
кто их тока не пилит. микрософт вон тоже с дотнетовым ядром пилит
источник

AE

Alexey Evdokimov in Data Engineers
на кой только непонятно
источник

AD

Albus Dumbledore in Data Engineers
Ну они вроде активно R вовлекают
источник

OI

Oleg Ilinsky in Data Engineers
Вопросик
Пытаюсь подключиться к thrift серверу beeline’ом и ловлю вот такую ошибку
20/07/29 13:01:36 DEBUG SQLCompleter: fail to get SQL key words from database metadata due to the exception: java.sql.SQLFeatureNotSupportedException: Method not supported
java.sql.SQLFeatureNotSupportedException: Method not supported


подключаюсь вот так: !connect jdbc:hive2://localhost:10001/;transportMode=http;httpPath=cliservice

Что-то бред какой-то. Никто не встречал такое?
источник