А внутри Спарк джоба , если у вас условно десяток Тб джобой обрабатываются и параллельно на этой ноде ещё что то крутится , предлагаете побольше дисков поставить на компьют ноды?
ну вот для половины данных и для кафки можно держать отдельные кластера поменьше, а для остального и каких-то больших пересчетов можно запускать отдельные, это же все автоматизировано обычно