вроде ты сказал масштабируемость это твоя хотелка. А про отказоустойчивость непонятно чего требует от тебя бизнес.
Ты лучше уточни задачу. Может быть норм будет, что бэкенд поволяется 5 минут, а потом переедет на другую ноду. Тогда просто пихни его в куб. Это конечно не отказоустойчивость, но может быть этого достаточно