Size: a a a

2021 April 19

Igor  Master in Data Engineers
Я быстро ничего найти не смог по этому пришел в этот чатик. Там все про foreachRDD но в foreachRDD я и сам догадаюсь try catch поставить.
источник

Igor  Master in Data Engineers
В любом случае спасибо, всем!
источник

N

Nikita Blagodarnyy in Data Engineers
Буквально на прошлой неделе на JPoint его обшлачивали яростно.
источник

GP

Grigory Pomadchin in Data Engineers
ну там есть проблемы
источник

N

Nikita Blagodarnyy in Data Engineers
А че, теперь это в моде, все уже реактивно бомбят?
источник

TZ

Timofey Zakrevskiy in Data Engineers
Добрый день!

У меня есть несколько вопросов по cuda/opengl/opencl и их привязкам к java в контексте вычислительной геометрии, и мне посоветовали спросить здесь. Это будет по теме канала или мне стоит обратиться куда-то ещё?
источник

AZ

Anton Zadorozhniy in Data Engineers
лучше в ODS
источник

TZ

Timofey Zakrevskiy in Data Engineers
а что такое ODS?
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

TZ

Timofey Zakrevskiy in Data Engineers
Спасибо!
источник
2021 April 20

SS

Sergey Sheremeta in Data Engineers
дяденьки, здравствуйте!
подскажите - кто-то использует Looker поверх Hive/Spark?
как решаете проблему получения схемы таблицы с "лишними" столбцами?

насколько я понимаю, Looker для определения схемы таблицы использует
DESCRIBE default.SEXY_TABLE

а для Hive/Spark там возвращается много лишнего, в частности пустые строки, которые превращаются в пустой dummy-столбец для Looker'а
источник

AM

Almaz Murzabekov in Data Engineers
А что если как воркароунд сделать вьюшку поверх hive таблицы?
источник

АА

Алексей Артамонов... in Data Engineers
всем привет! пытаюсь через spark подключится к clickhouse, потом делаю выборку из БД и хочу посмотреть датасет

```val ch_connect = spark.read.format("jdbc")
.option("url", "jdbc:clickhouse://localhost:8123")
.option("driver", "ru.yandex.clickhouse.ClickHouseDriver")
.option("dbtable", "blogger_subscribers")
.option("user", "default")
.option("password", "")
.load()


spark.
sqlContext.sql("SELECT * FROM default.blogger_subscribers").show()
```

ошибку получаю
Table or view not found: `default`.`blogger_subscribers`; line 1 pos 14;


может кто-то сталкивался ?
источник

NN

No Name in Data Engineers
Если я все правильно понял, то ch_connect - это и есть Ваша табличка в виде датафрейма, который просто нужно инициализировать. С ним и работайте. А то, что Вы дальше делаете - это попытка селектнуть таблицу из  дефолтного warehouse. Естественно, там нет такой таблицы.
источник

NB

Nikita Bakanchev in Data Engineers
CreateOrReplaceTempView для sql
источник

Igor  Master in Data Engineers
@scooby18 Тебе надо создать вьюху
ch_connect.createOrReplaceTempView("blogger_subscribers")
%sql
select * from blogger_subscribers
источник

АА

Алексей Артамонов... in Data Engineers
ну я пока локально разрабатываю поэтому интерпритатор цеппелина не использую
источник

АА

Алексей Артамонов... in Data Engineers
вот я не совсем понимаю зачем ему вью создавать
источник

NB

Nikita Bakanchev in Data Engineers
https://stackoverflow.com/questions/44011846/how-does-createorreplacetempview-work-in-spark вот тут объяснено на базовом уровне, но excellent name уже указал специфику
источник

AE

Alexey Evdokimov in Data Engineers
вопрос к любителям облаков.

есть какой-нить вменяемый способ обращаться из кластера на EMR к S3 за пределами амазона?
источник