не, я возился, но все таки следующее не понял как сделать:
у меня через римот интепретер процесс умирает примерно на том же(если на сервере напрямую скрипт прогоняю, все норм) месте обработки посредством kill,
пишет ошибка 137, что связанно обычно с памятью. к тому же проверил torch.cuda.is_available, говорит что нет.
попытался как писали офф. лица из джетбрейна настроить дистрибьтед ран как на картинке, но походу это не то (хз правильно ли сделал, было похоже что да, но процесс все равно умер примерно там же с тем же килом).
Как прогонять через римот интерпритатор с ресурсами, например парой cpu и gpu (как с srun)?
Вот с этим я не разобрался.