Неймнода и журналноды зачастую рейд на имейдж и wal
Датаноды обычно просто точки монтирования (до 20 встречал)
Можно и рейд 0 или желательно ссд для фолдеров куда yarn временные файлы пишет
Если скорость чтения с одного диска условные 100-150 мб в секунду , то получается , что датаноды тоже выдают скорость чтения в этом диапазоне ? И например если на датаноде запускается spark executor ,то все таски в нем будут делить эти 100-150 мб/сек между собой ?