Телеграмм чат группы hadoopusers страница 2622

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

1926 membersпожаловаться на группу

2020 August 12

AZ

Anton Zadorozhniy in Data Engineers

Повелитель Бури

Добрый! После перезагрузки дата нод они умерли. Я
запустил clousera agent и
сделал recommmision,
сделал fsk delete плохих блоков нет.
Перезааустил hdfs

Ноды все равно мертвы.я что то пропустил?

что значит умерли? что пишет CM, NN, что в логах агентов и DN?

источник

10:17пожаловаться #1

ПБ

Повелитель Бури... in Data Engineers

Anton Zadorozhniy

что значит умерли? что пишет CM, NN, что в логах агентов и DN?

Initialization failed for Block pool <registering> (Datanode Uuid b6fcbf7b-6c5a-461c-a497-a25d6ebf6a4d) service to 8022. Exiting.
java.io.IOException: All specified directories have failed to load.

источник

11:03пожаловаться #2

AZ

Anton Zadorozhniy in Data Engineers

Повелитель Бури

Initialization failed for Block pool <registering> (Datanode Uuid b6fcbf7b-6c5a-461c-a497-a25d6ebf6a4d) service to 8022. Exiting.
java.io.IOException: All specified directories have failed to load.

dfs.datanode.data.dir доступны?

источник

11:04пожаловаться #3

PA

Polina Azarova in Data Engineers

скорее всего айдишник кластера неймноды и датаноды разошлись
случайно не форматировали?

источник

11:04пожаловаться #4

AZ

Anton Zadorozhniy in Data Engineers

скорее всего айдишник кластера неймноды и датаноды разошлись
случайно не форматировали?

кмк он явно репортит Incompatible clusterIDs в таком случае, хотя мб и нет, я давно последний раз такое чинил

источник

11:09пожаловаться #5

ПБ

Повелитель Бури... in Data Engineers

скорее всего айдишник кластера неймноды и датаноды разошлись
случайно не форматировали?

возможно, если удалю кластер исправиться?

источник

11:09пожаловаться #6

AZ

Anton Zadorozhniy in Data Engineers

Повелитель Бури

возможно, если удалю кластер исправиться?

clusterID можно вроде посмотреть в current/VERSION, сравните их между неймнодой и датанодой

источник

11:11пожаловаться #7

ПБ

Повелитель Бури... in Data Engineers

скорее всего проблема здесь Lock on /data/dfs/dn/in_use.lock acquired by nodename

источник

11:11пожаловаться #8

SS

Sergey Sheremeta in Data Engineers

коллеги, привет!
работаю из DBeaver со Spark Thrift Server, при некотором простое рвется соединение - приходится его рефрешить. как следствие пропадают закешированные вьюхи-запросы.
как лечить?

источник

14:44пожаловаться #9

SS

Sergey Sheremeta in Data Engineers

spark.sql.hive.thriftServer.singleSession=true

оно?

источник

14:48пожаловаться #10

SB

Saveliy Belkin in Data Engineers

/data

источник

16:17пожаловаться #11

SS

Sergey Sheremeta in Data Engineers

подскажите, какие существуют "наилутшие" практики в перепроцессинге сырых данных в DataLake?
вот валится мне из Кафки поток json'ов - я его приземляю в parquet как текстовый столбец через spark structured streaming (это как говорят нынче "бронза").
другим SSS-джобом я парсю "бронзу" согласно схеме (определенной контрактом с поставщиком данных).
в какой-то момент выясняется, что схема изменилась (вот неожиданность-то!!!). либо я где-то напортачил в трансформациях...

и вот я судорожно поправил код джоба, передеплоил его! а что сейчас сделать с некорректными данными от прошлой версии джоба?

источник

19:19пожаловаться #12

U

Udemy4U in Data Engineers

Хотите получать курсы по программированию?

источник

19:26пожаловаться #13

A

Alex in Data Engineers

давай

источник

19:28пожаловаться #14

GP

Grigory Pomadchin in Data Engineers

источник

19:37пожаловаться #15

N

Nikita Blagodarnyy in Data Engineers

отправь смс «не лох» на 4242

источник

19:54пожаловаться #16

AE

Alexey Evdokimov in Data Engineers

не, надо «не мамонт» на 1337

источник

20:01пожаловаться #17

A

Alex in Data Engineers

чем больше смс отправишь тем больше ты “не …”

источник

20:14пожаловаться #18

S

Stanislav in Data Engineers

Sergey Sheremeta

подскажите, какие существуют "наилутшие" практики в перепроцессинге сырых данных в DataLake?
вот валится мне из Кафки поток json'ов - я его приземляю в parquet как текстовый столбец через spark structured streaming (это как говорят нынче "бронза").
другим SSS-джобом я парсю "бронзу" согласно схеме (определенной контрактом с поставщиком данных).
в какой-то момент выясняется, что схема изменилась (вот неожиданность-то!!!). либо я где-то напортачил в трансформациях...

и вот я судорожно поправил код джоба, передеплоил его! а что сейчас сделать с некорректными данными от прошлой версии джоба?

Загибаем пальцы: 3 копии данных в кафке, потом 3 копии в каком то сыром паркете, от 3 до 4 копий (а уж если есть бекап витрин, то множитель зашкаливает ) на следующем уровне :)
Основы курса - как сделать бигдату :)

Если серьёзно, если в потоке нет версии формата того, что летит - можно вроде изголяться как хочется. Включая проверку каким нить гоблиным данных на валидность модели в промежутке

источник

20:14пожаловаться #19

AS

Andrey Smirnov in Data Engineers

Sergey Sheremeta

подскажите, какие существуют "наилутшие" практики в перепроцессинге сырых данных в DataLake?
вот валится мне из Кафки поток json'ов - я его приземляю в parquet как текстовый столбец через spark structured streaming (это как говорят нынче "бронза").
другим SSS-джобом я парсю "бронзу" согласно схеме (определенной контрактом с поставщиком данных).
в какой-то момент выясняется, что схема изменилась (вот неожиданность-то!!!). либо я где-то напортачил в трансформациях...

и вот я судорожно поправил код джоба, передеплоил его! а что сейчас сделать с некорректными данными от прошлой версии джоба?

просто "наспросить", а почему паркет, я всегда считал что для такого лучше авро.

источник

20:18пожаловаться #20