Size: a a a

2021 April 21

AZ

Anton Zadorozhniy in Data Engineers
какая разница?
источник

K

KrivdaTheTriewe in Data Engineers
Где промежуточный результат хранить будете ?
источник

AZ

Anton Zadorozhniy in Data Engineers
если между спарк джобами - в HDFS, а внутри спарк джоба - на локальных дисках
источник

K

KrivdaTheTriewe in Data Engineers
Но зачем тогда комрьют и сторадж разделять в случае hdfs ?
источник

AZ

Anton Zadorozhniy in Data Engineers
потому что так удобнее управлять
источник

K

KrivdaTheTriewe in Data Engineers
А внутри Спарк джоба , если у вас условно десяток Тб джобой обрабатываются и параллельно на этой ноде  ещё что то крутится , предлагаете побольше дисков поставить на компьют ноды?
источник

K

KrivdaTheTriewe in Data Engineers
Нужно метрику удобства вводить
источник

AZ

Anton Zadorozhniy in Data Engineers
ну вот для половины данных и для кафки можно держать отдельные кластера поменьше, а для остального и каких-то больших пересчетов можно запускать отдельные, это же все автоматизировано обычно
источник

K

KrivdaTheTriewe in Data Engineers
Разделение компьюта и стораджа оч прикольно, но далеко это всегда возможно
источник

UD

Uncel Duk in Data Engineers
Проще скейлить
источник

UD

Uncel Duk in Data Engineers
Компут на блейды
источник

K

KrivdaTheTriewe in Data Engineers
Минио?
источник

AZ

Anton Zadorozhniy in Data Engineers
да, как в спарке на к8с вам нужны локальные диски на компьюте
источник

UD

Uncel Duk in Data Engineers
Данные на коробки с 90 дисков например, плюс порты от 100г
источник

UD

Uncel Duk in Data Engineers
классическая рахитектура из хпц
источник

K

KrivdaTheTriewe in Data Engineers
У вас map/reduce , вы джоините одну таблицу на другую, или ещё что то делаете , на блейды 12тб диски тож поставите ?
источник

AZ

Anton Zadorozhniy in Data Engineers
вообще удивительно, я думал все в курсе что локалити не нужно
источник

UD

Uncel Duk in Data Engineers
шафл по сети, у компутов нвме на эти 12 тер
источник

UD

Uncel Duk in Data Engineers
чисто под кэш
источник

K

KrivdaTheTriewe in Data Engineers
А можно просто взять унифицированное железо одинаковое и жить хорошо
источник