интересно, а вот если у меня в одной сети 2млн параметров, а в другой 10, и в ту и в ту я сначала загоняю 100 гигов данных, а затем 200... @miteigi вес чекпоинта с весами изменится?
в тестах я заметил, что есть оптимальный размер для приемлемого качества. перебор с исходными данными толку не дает особо, иногда хватает и оптимального размера. вот я браз 300мб исходного текста и фасттекс сделал модель на 300мб примерно. работает очень быстро, хоть и с ошибками.
просто конкурс вгоняет в тупые рамки. зачем мне пыжится улучшать модель, тестить чтобы она влилась в святые 200мб, если он работает хорошо лишь на 300 мб
просто конкурс вгоняет в тупые рамки. зачем мне пыжится улучшать модель, тестить чтобы она влилась в святые 200мб, если он работает хорошо лишь на 300 мб