Когда один воркер одну часть молотит, второй другую часть
Выходит , что один воркер ( одна таска) все же работает в ситуации , когда она один блок читает с одного диска и соответственно ее скорость ограничена этими 100 мб/сек
А вот если на датаноде работают одновременно 2 таски , то они потенциально могут и с большей скоростью читать , если данные на разных дисках. Но тут вопрос как тот же hdfs пишет блоки. Будет ли он стараться записывать разные блоки одного и того же файла на разные диски