добавить слои к gpt2 вы можете и так, используя предобученные веса.
хочется метафорически предположить, что добавить слоев к гпт2, чтобы получить гпт3 — это по масштабам как добавить 99 этажей к двухэтажному дачному домику, чтобы получить небоскреб.
хочется метафорически предположить, что добавить слоев к гпт2, чтобы получить гпт3 — это по масштабам как добавить 99 этажей к двухэтажному дачному домику, чтобы получить небоскреб.
не могу не согласиться, но коли человеку хочется чем-то заняться
не могу не согласиться, но коли человеку хочется чем-то заняться
выглядит, что человек хочется доказать свою позицию. при этом еще издалека: "я-ничего-не-понимаю-в-дс". но это классно, что ты видишь нечто большее. я что-то быстро сдался. утро видимо)))
выглядит, что человек хочется доказать свою позицию. при этом еще издалека: "я-ничего-не-понимаю-в-дс". но это классно, что ты видишь нечто большее. я что-то быстро сдался. утро видимо)))
меня порадовал пассаж про "зачем мне загружать большую модель в gpu, если файл ipynb такой маленький и чудесно помещается в колаб"