Телеграмм чат группы hadoopusers страница 1943

До этого диски по round Robin долбились,

потом добавили проверку на свободное место, чтобы более равномерно заполнялись

Потом добавили балансировка в пределах ноды

источник

18:26пожаловаться #9

ʏᴍ

ʏᴜʀɪʏ ᴍᴀʟʏɢɪɴ in Data Engineers

оу, вы настолько древние версии вспомнили

источник

18:26пожаловаться #10

ʏᴍ

ʏᴜʀɪʏ ᴍᴀʟʏɢɪɴ in Data Engineers

я подумал что речь про современный hadoop, сорян

источник

18:27пожаловаться #11

Alex in Data Engineers

Ну в современном и указал что там и в пределах ноды сейчас многие проблемы с балансировкой решили :)

источник

18:28пожаловаться #12

Tatiana in Data Engineers

ʏᴜʀɪʏ ᴍᴀʟʏɢɪɴ

Это не проблема, а контролируемое поведение. Есть параметр отвечающий за вес

А какая настройка ?

источник

18:28пожаловаться #13

Tatiana in Data Engineers

Alex

Ну в современном и указал что там и в пределах ноды сейчас многие проблемы с балансировкой решили :)

А по каким словам поискать про этот алгоритм? Если он пишет по round robin , то можно рассчитывать на больший сроупут

источник

18:30пожаловаться #14

Tatiana in Data Engineers

Вот если у меня допустим 5 датанод. Нейнода будет выделять одну из датанод для записи блока и если каждый раз для одной датаноды блоки будут в разные маунтпоинты попадать , то можно рассчитывать , что и читать я буду со всех дисков в параллель ( когда много тасков )

источник

18:33пожаловаться #15

Alex in Data Engineers

Клиент стучится на неймноду говорит хочу писать файл

Она отвечает пиши блок вот на эту датаноду

Клиент подключился и пишет в пределах размера блока

Потом стучится повторно на неймноду и говорит хочу дальше писать

Неймнода отвечает пиши следующий блок вот на эту ноду

Неймнода не знала раньше про то сколько дисков у Датаноды, была инфа только какие блоки на какой датаноде лежат

Роундробин и тд это внутренняя реализация в датаноде

Название параметра переключения алгоритмов на датаноде я так и не вспомню сейчас

источник

18:34пожаловаться #16

Alex in Data Engineers

Датаноды ничего не знают о файлах, просто блок айди и все

источник

18:35пожаловаться #17

Alex in Data Engineers

Один это файл или разные никаких данных они не имеют

источник

18:35пожаловаться #18

Alex in Data Engineers

Это как диск не понимает о том какие блоки к какому файлу принадлежат, для этого служит fs на уровне операционки

источник

18:36пожаловаться #19

2020 January 07

panda in Data Engineers

может кто-то сталкивался: на маке развернут докер контейнер с постгрес, хочу с другого компа по локалке обратиться к контейнеру, не видит. Кто нить сталкивался?

источник

09:46пожаловаться #20