Телеграмм чат группы hadoopusers страница 3454

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2372 membersпожаловаться на группу

2021 March 30

YL

Yuri Lyulchenko in Data Engineers

Там за 100 полей. Ну понятно, что мне в итоге нужны далеко не все. Т.е. в итоге правильно подложить свою схему, например (по User.class - 7 полей, например), сериализовать с ее помощью в объект User?

источник

11:36пожаловаться #1

UR

Uncle Ruckus in Data Engineers

Там за 100 полей - так все равно pojo должно быть обьявлено.

источник

11:37пожаловаться #2

YL

Yuri Lyulchenko in Data Engineers

Сорян, если тупые вопросы, это все новое для меня

источник

11:37пожаловаться #3

UR

Uncle Ruckus in Data Engineers

причем локально. Вот этот самый GenericRecord

источник

11:37пожаловаться #4

YL

Yuri Lyulchenko in Data Engineers

ConfluentRegistryAvroDeserializationSchema.forGeneric(schema) - есть такая вариация

источник

11:37пожаловаться #5

UR

Uncle Ruckus in Data Engineers

Yuri Lyulchenko

ConfluentRegistryAvroDeserializationSchema.forGeneric(schema) - есть такая вариация

подозреваю в обертке schema pojo все равно есть

источник

11:38пожаловаться #6

А

Алексей in Data Engineers

Кто-нить пользовался БД Terrarium - это правда что они заявляют?

источник

11:39пожаловаться #7

UR

Uncle Ruckus in Data Engineers

Yuri Lyulchenko

Сорян, если тупые вопросы, это все новое для меня

А с жабой теперь всегда все будет новое, из нее SAP делают ;)

источник

11:39пожаловаться #8

UR

Uncle Ruckus in Data Engineers

Я думаю если показать этот код автору любой книжки по java 10летней давности тогда - он бы повесился

источник

11:40пожаловаться #9

AZ

Anton Zadorozhniy in Data Engineers

Кто-нить пользовался БД Terrarium - это правда что они заявляют?

это Synerise?

источник

11:40пожаловаться #10

А

Алексей in Data Engineers

Anton Zadorozhniy

это Synerise?

да

источник

11:41пожаловаться #11

AZ

Anton Zadorozhniy in Data Engineers

да

кмк их нельзя с КХ напрямую сравнивать, Сайнрайз это готовые сервисы. а не дата менеджмент платформа

источник

11:44пожаловаться #12

YL

Yuri Lyulchenko in Data Engineers

@Uncle_Ruckus А еще вот последний вариант, который вы предложили в самом начале:

    private static FlinkKafkaConsumer<GenericRecord> getConsumer(String topic) {

        Schema schema = ReflectData.get().getSchema(User.class);
        return new FlinkKafkaConsumer<>(
                topic,
                AvroDeserializationSchema.forGeneric(schema),
                getConsumerProperties());

    }

java.io.EOFException
               at org.apache.avro.io.BinaryDecoder.ensureBounds(BinaryDecoder.java:510)
               at org.apache.avro.io.BinaryDecoder.readInt(BinaryDecoder.java:150)
               at org.apache.avro.io.ValidatingDecoder.readInt(ValidatingDecoder.java:82)
               at org.apache.avro.generic.GenericDatumReader.readInt(GenericDatumReader.java:551)
               at org.apache.avro.generic.GenericDatumReader.readWithoutConversion(GenericDatumReader.java:195)
               at org.apache.avro.generic.GenericDatumReader.readArray(GenericDatumReader.java:298)
               at org.apache.avro.generic.GenericDatumReader.readWithoutConversion(GenericDatumReader.java:183)
               at org.apache.avro.generic.GenericDatumReader.read(GenericDatumReader.java:160)
               at org.apache.avro.generic.GenericDatumReader.readField(GenericDatumReader.java:259)
               at org.apache.avro.generic.GenericDatumReader.readRecord(GenericDatumReader.java:247)
               at org.apache.avro.generic.GenericDatumReader.readWithoutConversion(GenericDatumReader.java:179)
               at org.apache.avro.generic.GenericDatumReader.read(GenericDatumReader.java:160)
               at org.apache.avro.generic.GenericDatumReader.read(GenericDatumReader.java:153)
               at org.apache.flink.formats.avro.AvroDeserializationSchema.deserialize(AvroDeserializationSchema.java:139)
               at org.apache.flink.api.common.serialization.DeserializationSchema.deserialize(DeserializationSchema.java:82)
               at org.apache.flink.streaming.connectors.kafka.internals.KafkaDeserializationSchemaWrapper.deserialize(KafkaDeserializationSchemaWrapper.java:58)
               at org.apache.flink.streaming.connectors.kafka.internals.KafkaFetcher.partitionConsumerRecordsHandler(KafkaFetcher.java:179)
               at org.apache.flink.streaming.connectors.kafka.internals.KafkaFetcher.runFetchLoop(KafkaFetcher.java:142)
               at org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumerBase.run(FlinkKafkaConsumerBase.java:826)
               at org.apache.flink.streaming.api.operators.StreamSource.run(StreamSource.java:110)
               at org.apache.flink.streaming.api.operators.StreamSource.run(StreamSource.java:66)
               at org.apache.flink.streaming.runtime.tasks.SourceStreamTask$LegacySourceFunctionThread.run(SourceStreamTask.java:241)

источник

11:44пожаловаться #13

YL

Yuri Lyulchenko in Data Engineers

Можете подсказать, куда копнуть?

источник

11:45пожаловаться #14

А

Алексей in Data Engineers

Anton Zadorozhniy

кмк их нельзя с КХ напрямую сравнивать, Сайнрайз это готовые сервисы. а не дата менеджмент платформа

ну они сами себя сравнивают https://www.linkedin.com/pulse/synerise-terrarium-massive-scale-in-memory-storage-built-krolewski

Synerise Terrarium - a massive scale in-memory storage built from scratch

Terrarium is a column and row store engine designed specifically for behavioral intelligence, real-time data processing, and is the core of the Synerise platform. It simultaneously processes data heavy analytics while executing various business scenarios in real-time.

источник

11:48пожаловаться #15

AZ

Anton Zadorozhniy in Data Engineers

ну они сами себя сравнивают https://www.linkedin.com/pulse/synerise-terrarium-massive-scale-in-memory-storage-built-krolewski

Synerise Terrarium - a massive scale in-memory storage built from scratch

Terrarium is a column and row store engine designed specifically for behavioral intelligence, real-time data processing, and is the core of the Synerise platform. It simultaneously processes data heavy analytics while executing various business scenarios in real-time.

ну я про это ничего не слышал, и он пишет что только "soon Terrarium will debut as a standalone product" - видимо тогда и поглядим

источник

11:50пожаловаться #16

AZ

Anton Zadorozhniy in Data Engineers

SQL не умеет (я запутался уже, это значит что продукт хороший или плохо? 😊)

источник

11:51пожаловаться #17

А

Алексей in Data Engineers

ну они пишут, что хорошо)

источник

11:51пожаловаться #18

AZ

Anton Zadorozhniy in Data Engineers

отлично значит, пусть цветут все цветы

источник

11:52пожаловаться #19

AZ

Anton Zadorozhniy in Data Engineers

вон как популярна MongoDB для аналитики, значит и эти заживут 🙃

источник

11:53пожаловаться #20