Телеграмм чат группы hadoopusers страница 2926

spark.conf.set("spark.sql.autoBroadcastJoinThreshold", 1)
spark.conf.set("spark.sql.join.preferSortMergeJoin", false)
spark.conf.set("spark.sql.adaptive.enabled", false)

val dataset = Seq(
  (0, "playing"),
  (1, "with"),
  (2, "ShuffledHashJoinExec")
).toDF("id", "token")

val q = dataset.hint("shuffle_hash").join(dataset, Seq("id"))
q.explain

А где бы про все доступные хинты узнать?

источник

00:14пожаловаться #16

Renarde in Data Engineers

Alexander Gorokhov

А где бы про все доступные хинты узнать?

https://spark.apache.org/docs/3.0.0/sql-ref-syntax-qry-select-hints.html

источник

00:37пожаловаться #17

Sergey Sheremeta in Data Engineers

приветики! а тут есть специалисты по Apache NiFi? (в профильном чате был, там молчат на мой вопрос)

источник

10:46пожаловаться #18

Sergey Sheremeta in Data Engineers

подскажите, пожалуйста, как через LookupRecord добавить результат RestLookupService, возвращаемый как JSON, как строковое поле в record-set?
вот такая авро-схема для моего record-set'а:
{
"name": "Documents",
"namespace": "nifi",
"type": "record",
"fields": [
{ "name": "docId", "type": "string" },
{ "name": "type", "type": "string" },
{ "name": "docBody", "type": "string" }
]
}

процессор LookupRecord выгребает из RestLookupService для каждого docId тело документа - это тело в формате json
и я не могу сообразить как мне этот json конвертнуть в строку, чтобы она корректно влезла в поле docBody
на выходе получаю такое:

{
"docId" : "URCPT00000000000000168093-6145",
"type" : "RECEIPT",
"docBody" : "MapRecord[{receipt=MapRecord[{dateTime=1604304000, indicationfiscalSign=0, fiscalDocumentFormatVer=2, code=3, userInn=000000000, operationType=1, taxationType=1, items=[Ljava.lang.Object;@7d1ca244]}]"
}

источник

10:47пожаловаться #19

АС

Артур Семенов... in Data Engineers

Всем привет, кто-нибудь использует какие-нибудь формулы для создания Спарк приложений, чтобы корректно (оптимально) использовать ресурсы кластера, если вас на нем фиксированное количество человек?
Речь про настройку Спарк контекста
Поделитесь плиз опытом

источник

17:01пожаловаться #20