он ради такой операции конечно же не будет делать редьюс и пихать все на одну машину
Я понял, спасибо.
Можно пояснить более практический момент, например, если создан RDD, идут трансформации, один из тасков фейлится четыре раза (лимит ретраев) и приложение аварийно завершается с исключением job aborted, то при каких настройках его можно восстановить с последнего чекпоинта?