Привет, ребята. Хочу зафайнтюнить модель t5-11b но вот беда она не влезает ни в видеокарту ни в TPU, нотбук colab крашится по истощению ресурсов. Тренировать придётся в облаке амазона, и выходов вижу 2 - арендовать простой инстанс с кучей памяти и тренировать на CPU либо арендовать инстанс на 4 видюхи, но тогда нужно озаботиться model parallelism.
С первым вариантом всё понятно, это можно всегда попробовать, но очевидно что это будет долго. А вот с паралелизмом модели я разобраться пытался. Встроенного в библиотеку huggingface решения не существует, точнее его пытались написать, но ветку так и не смерждили в мастер, что-то у них некурлычит видимо. Пытался сам смерджить локально - всё равно не фурычит. Нашел еще библиотеку Eisen которая обещает сделать параллелизм в одну строку. Но по факту поддерживает только модели с одним входом. А так как на t5 2 входа - токены и маска, то eisen уже не фурычит.
Может ли кто-нибудь подсказать еще какие-нибудь варианты файнтюнинга t5-11b с уже готовым параллелизмом модели?