Телеграмм чат группы hadoopusers страница 2593

2020 July 29

Д

Дмитрий in Data Engineers

За необходимую надежность платишь деньги.

источник

23:21пожаловаться #1

AZ

Anton Zadorozhniy in Data Engineers

Nikita Blagodarnyy

Вы, насколько я понимаю, специалист по облакам. Как это решается, например, в s3?

для разных угроз разные механизмы, от MFA Delete и версионирования, до cross-region replication (там удаления в сорце транслируются в специальные маркеры в таргете)

источник

23:22пожаловаться #2

N

Nikita Blagodarnyy in Data Engineers

мир не ограничен банками. транзакции не только в них. в убер тоже финансовые транзакции. в нетфликс тоже небесплатно кино показывают.

источник

23:23пожаловаться #3

DT

Dmitry Titov in Data Engineers

Nikita Blagodarnyy

мир не ограничен банками. транзакции не только в них. в убер тоже финансовые транзакции. в нетфликс тоже небесплатно кино показывают.

Ну там и постгреса хватит, что бы кино показывать

источник

23:23пожаловаться #4

DT

Dmitry Titov in Data Engineers

вот рекомендовать это другое дело

источник

23:23пожаловаться #5

Д

Дмитрий in Data Engineers

Nikita Blagodarnyy

мир не ограничен банками. транзакции не только в них. в убер тоже финансовые транзакции. в нетфликс тоже небесплатно кино показывают.

Но финасовые транзакции юбера и нетфликс идут то через банки, а палка одна из больших потребителей оракла.

источник

23:24пожаловаться #6

SS

Sergey Sheremeta in Data Engineers

коллеги. здравствуйте!
подскажите, как вы пишете юнит-тесты на свои spark structured streaming джобы?
по канону вроде как надо разбивать джобу на стадии read, transform, write - и тестировать каждую отдельно.
а если у меня джоба джойнит несколько стримов?

источник

23:28пожаловаться #7

2020 July 30

AS

Andrey Smirnov in Data Engineers

Дмитрий

Надежност на 2 странице.

прямо как у garmin

источник

00:12пожаловаться #8

ЮЗ

Юрий Зенин in Data Engineers

Дмитрий

Если будешь отдельно копировать бд метастора, а затем hdfs, получишь разбег данных, мы это уже проходили. Локтикусали сильно .... сейчас делаем export table и копирование hdfs, но нам это надо при переезде на другой кластер.

А что конкретно разъезжается в первом случае? Схемы таблиц?

источник

09:27пожаловаться #9

Д

Дмитрий in Data Engineers

Юрий Зенин

А что конкретно разъезжается в первом случае? Схемы таблиц?

Метаданные, с фактическими данными, кажлый раз натыкался. При export table, такое случается более редко, на моей практике ни разу. Но теоретически возможно.

источник

09:30пожаловаться #10

A

Alex in Data Engineers

Привет! Сегодня обнаружил в логах работающей всю ночь спарк джобы такой экспепшин - "Spark java.io.IOException: All datanodes are bad. Aborting.." Запускаю на AWS EMR. На Resource Manager url зайти не могу. не отвечает. Как лечить такое ?

источник

09:47пожаловаться #11

S

Stanislav in Data Engineers

Nikita Blagodarnyy

либо вы строите процессы так, что один уставший админ может остановить цод, либо его на этом пути остановит несколько кордонов.

сразу видно, что далеко от мира опсов :)
хотя бы один раз в жизни опс путает консоли серверов разных энвов например )

источник

09:59пожаловаться #12

S

Stanislav in Data Engineers

и хорошо, если это было на прошлой работе :)

источник

09:59пожаловаться #13

R

Rodion in Data Engineers

Всем привет, стало интерсно, а почему при инсерте, спакр вставляет не по именам, а по номерам слолбцов? Он же все равно падает с ошибкой, если есть одинаковые названия

источник

16:53пожаловаться #14

DZ

Dmitry Zuev in Data Engineers

Rodion

Всем привет, стало интерсно, а почему при инсерте, спакр вставляет не по именам, а по номерам слолбцов? Он же все равно падает с ошибкой, если есть одинаковые названия

Насколько я помню это связано с кодгеном

источник

17:22пожаловаться #15

N

Nikolay in Data Engineers

Dmitry Zuev

Насколько я помню это связано с кодгеном

Значит ли это ,что до того , как появился кодген это было иначе ?

источник

17:24пожаловаться #16

DZ

Dmitry Zuev in Data Engineers