ну оптимизации - это хорошо. но, будем откровенны, на них рехнуться можно. ведь даже SMP не такой уж и Symmetric с точки зрения доступа к памяти) если же речь еще и про MPI, то, в идеале, надо учитывать архитектуру кластера для минимизации траффика. если еще есть IO, то в случае с тем же hdf5 можно подбирать размер шардов, сжатие и тд. а ведь еще уровень ниже. Например на уровне юзерспейса та же Lustre дает возможность оптимизировать IO за счет управления страйпингом.
так что оптимизировать нужно конкретную задачу под конкретный сетап) и то, если человекочасы на оптимизацию окупают сокращение человеко или компьютеро часов на продакшн работу)
ну, в общем, вопрос не только в стоимости человекочасов, сколько во времени, например, вам валятся данные с сети метеодатчиков, коих много и хочется каждый день иметь уточнение прогноза (то есть перестроение модели), а если модель престраивается больше трети суток, то как бы уже и не надо )