Size: a a a

2021 July 28

t

tenKe in Data Engineers
попробуй запихнуть опцию про крио в создание сессии - не думаю что его на лету можно менять
источник

MV

Mitya Volodin in Data Engineers
Если хадуп керберезированный, то надо смотреть на настройки провизии пользаков.

Может забирать с хоста, может работать через LDAP.
В первом случае может хост быть впилен в домен через SSSD -  вот в этом, а также в случае LDAP, пользак должен быть известен каталогу (и быть в KDC).
источник

E

Evgeny in Data Engineers
кто нибудь  объединял spark_cassandra_connector с scylla-driver?
источник

GP

Grigory Pomadchin in Data Engineers
не очень ясен вопрос, но что мешает просто кассанда корректорши пользоваться?
источник

NB

Nikita Bakanchev in Data Engineers
Привет, нубский вопрос по BigQuery. Есть таблица T с около 50 полями.

select * from T where a3 > timestamp_sub(current_timestamp(), INTERVAL 15 MINUTE). Кластеризация по полям a1, a2.

Почему он вычитал не FULL SCAN таблицу по прайсингу.
При этом в детализации запроса не все поля указаны в stage0 из таблицы.

Он типа пробежался фильтром по одной колонке и потом вывел строки по ID. От этого процессинг сильно меньше по цене?
источник

AK

Alex Kirin in Data Engineers
Коллеги, как в Hive вывести значение запроса не в виде столбцов, а в виде строки? Подскажите, плиз
источник

E

Evgeny in Data Engineers
scylla-driver более оптимизирован для scylla
источник

GP

Grigory Pomadchin in Data Engineers
ну форкни проект заиспользуй сцилла драйвер
не уверен что это даст тебе преимуществ ведь сцилла драйвер это форк кассандра датастакс драйвера
источник

GP

Grigory Pomadchin in Data Engineers
а будет использоваться пересекающийся функционал который работать будет одинаково
источник

GP

Grigory Pomadchin in Data Engineers
наверное вся разница в разных конфиуграциях соединения и если тебе это важно оне вижу причин почему идея с форком не сработает
источник

AE

Alexey Evdokimov in Data Engineers
задам очередной глупый вопрос
источник

AE

Alexey Evdokimov in Data Engineers
есть какой-нить штатный способ залезть в даг окромя rdd.toDebugString()?
источник

AE

Alexey Evdokimov in Data Engineers
а то чего-то оч. хочется научиться расставлять по дагу rdd.persist() автоматически
источник

AE

Alexey Evdokimov in Data Engineers
вопрос каким макаром такой трюк проделать, чтобы не было мучительно больно
источник

ЕГ

Евгений Глотов... in Data Engineers
Лучше писать запросы так, чтобы персист не требовался)
источник

ЕГ

Евгений Глотов... in Data Engineers
Так как он чаще всего только замедляет чаще всего
источник

AE

Alexey Evdokimov in Data Engineers
не про spark sql речь
источник

AE

Alexey Evdokimov in Data Engineers
...а про выполнение кусков дага в цикле, например
источник

AZ

Anton Zadorozhniy in Data Engineers
> дага в цикле
Хм
источник

AE

Alexey Evdokimov in Data Engineers
или если мне надо сплитнуть рдд на кучку меньших по значениям в поле каком-нить
источник