Size: a a a

2021 January 22

A

Alex in Data Engineers
(тот случай когда у флинка писали сразу java апи, скалу потом подтягивали)
источник

A

Alex in Data Engineers
в спарке наоборот было
источник

A

Alex in Data Engineers
а автозахват TypeInformation из GenericRecord отработал криво
источник

A

Alex in Data Engineers
def addSource[T: TypeInformation](function: SourceFunction[T]): DataStream[T] = {
 require(function != null, "Function must not be null.")
 
 val cleanFun = scalaClean(function)
 val typeInfo = implicitly[TypeInformation[T]]
 asScalaStream(javaEnv.addSource(cleanFun, typeInfo))
}
источник

A

Alex in Data Engineers
а явно в параметрах скормить typeInfo нету в скала апи

страдать
источник

RK

Ruslan Ksalov in Data Engineers
Переписывать на Java? Или как-то можно костыльнуть?
источник

RK

Ruslan Ksalov in Data Engineers
😭
источник

A

Alex in Data Engineers
val javaStream = env.getJavaEnv.addSource(new FlinkKafkaConsumer[GenericRecord](
   kafkaTopic, ConfluentRegistryAvroDeserializationSchema.forGeneric(schema, schemaRegistryURL), properties),
 new GenericRecordAvroTypeInfo(schema))

val stream = new DataStream[GenericRecord](javaStream)
источник

A

Alex in Data Engineers
попробуйте
источник

A

Alex in Data Engineers
источник

RK

Ruslan Ksalov in Data Engineers
да, сейчас попробую, отходил пострадать)
источник

RK

Ruslan Ksalov in Data Engineers
@xhumanoid храни тебя господь и жену хорошую
источник

A

Alex in Data Engineers
разведён
источник

RK

Ruslan Ksalov in Data Engineers
работает
источник

RK

Ruslan Ksalov in Data Engineers
Alex
разведён
ну тогда гарем тебе султанский
источник

A

Alex in Data Engineers
вообще у flink java апи более юзабельна, пускай более многословна =\ нюансы разработки
источник

AE

Alexey Evdokimov in Data Engineers
а ни у кого часом не возникало необходимости бродкастнуть пачку geojson мегов этак на 600 на каждый екзекутор? смотрю что щас по логам что крио делает, и какое время уходит на GC, и как-то нехорошо становится
источник

AE

Alexey Evdokimov in Data Engineers
что прямо исходным текстом раскидывать и парсить внутри мапПартишен, что объектом (а дорожная сеть это нехилый такой граф), всё плохо
источник

K

KrivdaTheTriewe in Data Engineers
Alexey Evdokimov
а ни у кого часом не возникало необходимости бродкастнуть пачку geojson мегов этак на 600 на каждый екзекутор? смотрю что щас по логам что крио делает, и какое время уходит на GC, и как-то нехорошо становится
А почему не на драйвере запарсить?
источник

AE

Alexey Evdokimov in Data Engineers
600 мег это сам JSON, в памяти около 7 гигов
источник