не путай персист и чекйпонт
Вот я и не хочу их путать, исторически сложилось, что persist (cache) не помог на рабочих данных ни разу, только на метаинформации. А чекпоинта не использовал вообще, видя аннотацию Experimental. Хотя сейчас может быть очень актуально, потому что для восстановления я делю приложение на этапы, этапы на шаги и так далее. Приложение само узнаёт, где завершилось и надо ли продолжать. Но если какой-то шаг длится несколько часов и падает ближе к окончанию, то мой подход не годится. Похоже, чекпоинты могли бы помочь, но я не уверен, что их вообще можно использовать в проде с таким описанием