Телеграмм чат группы hadoopusers страница 3521

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2397 membersпожаловаться на группу

2021 April 21

AZ

Anton Zadorozhniy in Data Engineers

какая разница?

источник

20:20пожаловаться #1

K

KrivdaTheTriewe in Data Engineers

Где промежуточный результат хранить будете ?

источник

20:20пожаловаться #2

AZ

Anton Zadorozhniy in Data Engineers

если между спарк джобами - в HDFS, а внутри спарк джоба - на локальных дисках

источник

20:21пожаловаться #3

K

KrivdaTheTriewe in Data Engineers

Но зачем тогда комрьют и сторадж разделять в случае hdfs ?

источник

20:21пожаловаться #4

AZ

Anton Zadorozhniy in Data Engineers

потому что так удобнее управлять

источник

20:21пожаловаться #5

K

KrivdaTheTriewe in Data Engineers

А внутри Спарк джоба , если у вас условно десяток Тб джобой обрабатываются и параллельно на этой ноде ещё что то крутится , предлагаете побольше дисков поставить на компьют ноды?

источник

20:23пожаловаться #6

K

KrivdaTheTriewe in Data Engineers

Нужно метрику удобства вводить

источник

20:23пожаловаться #7

AZ

Anton Zadorozhniy in Data Engineers

ну вот для половины данных и для кафки можно держать отдельные кластера поменьше, а для остального и каких-то больших пересчетов можно запускать отдельные, это же все автоматизировано обычно

источник

20:24пожаловаться #8

K

KrivdaTheTriewe in Data Engineers

Разделение компьюта и стораджа оч прикольно, но далеко это всегда возможно

источник

20:24пожаловаться #9

UD

Uncel Duk in Data Engineers

Проще скейлить

источник

20:24пожаловаться #10

UD

Uncel Duk in Data Engineers

Компут на блейды

источник

20:25пожаловаться #11

K

KrivdaTheTriewe in Data Engineers

Минио?

источник

20:25пожаловаться #12

AZ

Anton Zadorozhniy in Data Engineers

да, как в спарке на к8с вам нужны локальные диски на компьюте

источник

20:25пожаловаться #13

UD

Uncel Duk in Data Engineers

Данные на коробки с 90 дисков например, плюс порты от 100г

источник

20:25пожаловаться #14

UD

Uncel Duk in Data Engineers

классическая рахитектура из хпц

источник

20:25пожаловаться #15

K

KrivdaTheTriewe in Data Engineers

У вас map/reduce , вы джоините одну таблицу на другую, или ещё что то делаете , на блейды 12тб диски тож поставите ?

источник

20:25пожаловаться #16

AZ

Anton Zadorozhniy in Data Engineers

вообще удивительно, я думал все в курсе что локалити не нужно

источник

20:26пожаловаться #17

UD

Uncel Duk in Data Engineers

шафл по сети, у компутов нвме на эти 12 тер

источник

20:26пожаловаться #18

UD

Uncel Duk in Data Engineers

чисто под кэш

источник

20:26пожаловаться #19

K

KrivdaTheTriewe in Data Engineers

А можно просто взять унифицированное железо одинаковое и жить хорошо

источник

20:26пожаловаться #20