Size: a a a

2020 August 08

MB

Mikhail Butalin in Data Engineers
гыг
источник

MB

Mikhail Butalin in Data Engineers
принято, спасибо за наводку
источник

A

Alex in Data Engineers
источник

A

Alex in Data Engineers
вот описание, что даже это не спасает
патч делали, но не влили
источник

A

Alex in Data Engineers
https://issues.apache.org/jira/browse/HDFS-11313

вот где я сегментирование видел, но тоже ещё не сделано
источник

A

Alex in Data Engineers
ну и там же про
https://issues.apache.org/jira/browse/HADOOP-16452
Increase ipc.maximum.data.length default from 64MB to 128MB

в 3.3, но это можно сделать и без обновления хадупа, просто параметром
источник

S

Stanislav in Data Engineers
Я бенчил ванильный хадуп3 на 14 тб, проблем не заметил. Правда я его и не забивал на значимую цифру, просто скорость выжимал. И дисков было много, 30+
источник

MB

Mikhail Butalin in Data Engineers
30+ на 1 ноду?
источник

S

Stanislav in Data Engineers
Да
источник

S

Stanislav in Data Engineers
30+ дисков
источник

MB

Mikhail Butalin in Data Engineers
ничётак...
источник

MB

Mikhail Butalin in Data Engineers
через СХД или напрямую подключали?
источник

S

Stanislav in Data Engineers
Напрямую жбод
источник

A

Alex in Data Engineers
а зачем jbod ?
потеря одного утягивает все диски в связке
источник

A

Alex in Data Engineers
некорректный вопрос, я с другим перепутал
источник

A

Alex in Data Engineers
я со SPAN перепутал
источник

S

Stanislav in Data Engineers
Ага. Но целевое решение сильно больше по обьемам, решили не ставить хдфс. Хотя побенчам он упёрся в шину, и архитектура похожа
источник

A

Alex in Data Engineers
просто все сетапы где явно упоминался jbod построены были на “сделать конкатенацию дисков в один большой логический”
но в контексте hdfs который поддерживает разные точки datadirs не совсем понятен был смысл
так как лишь усложняет обслуживание при выходе одного из дисков
источник

S

Stanislav in Data Engineers
Alex
просто все сетапы где явно упоминался jbod построены были на “сделать конкатенацию дисков в один большой логический”
но в контексте hdfs который поддерживает разные точки datadirs не совсем понятен был смысл
так как лишь усложняет обслуживание при выходе одного из дисков
Да это бессмысленно на таких объёмах. Но все конечно зависит от кейса
источник

A

Alex in Data Engineers
да
источник