Size: a a a

Natural Language Processing

2020 July 15

D

Den in Natural Language Processing
GPT-2 туда ещё не портировали
источник

I

I Апрельский... in Natural Language Processing
источник

D

Den in Natural Language Processing
Gshard забыл
источник

AI

Andrew Ishutin in Natural Language Processing
Den
GPT-2 туда ещё не портировали
портировали https://github.com/ConnorJL/GPT2
источник

D

Den in Natural Language Processing
а в transformers его нет
источник

I

I Апрельский... in Natural Language Processing
toriningen
добавить слои к gpt2 вы можете и так, используя предобученные веса.
хочется метафорически предположить, что добавить слоев к гпт2, чтобы получить гпт3 — это по масштабам как добавить 99 этажей к двухэтажному дачному домику, чтобы получить небоскреб.
источник

t

toriningen in Natural Language Processing
I Апрельский
хочется метафорически предположить, что добавить слоев к гпт2, чтобы получить гпт3 — это по масштабам как добавить 99 этажей к двухэтажному дачному домику, чтобы получить небоскреб.
не могу не согласиться, но коли человеку хочется чем-то заняться
источник

t

toriningen in Natural Language Processing
и ответ "не выйдет никак" не принимается категорически
источник

v

vy in Natural Language Processing
источник

AI

Andrew Ishutin in Natural Language Processing
Den
а в transformers его нет
источник

D

Den in Natural Language Processing
toriningen
не могу не согласиться, но коли человеку хочется чем-то заняться
у человека необходимость, ему надо модель для инструмента которая не тупит так сильно как ванильный gpt-2
источник

t

toriningen in Natural Language Processing
"тупит" в значении времени инференса или в значении перплексити?
источник

t

toriningen in Natural Language Processing
если время инференса, то больше слоев будет считаться еще дольше
источник

t

toriningen in Natural Language Processing
если перплексити, то вы не дообучите gpt2 на большем количестве слоев до хорошего результата
источник

I

I Апрельский... in Natural Language Processing
toriningen
не могу не согласиться, но коли человеку хочется чем-то заняться
выглядит, что человек хочется доказать свою позицию. при этом еще издалека: "я-ничего-не-понимаю-в-дс". но это классно, что ты видишь нечто большее. я что-то быстро сдался. утро видимо)))
источник

D

Den in Natural Language Processing
toriningen
"тупит" в значении времени инференса или в значении перплексити?
не знаю как точно размаппить моё объяснение выше по этим терминам, однако я использую GPT-2 XL предобученный
источник

t

toriningen in Natural Language Processing
I Апрельский
выглядит, что человек хочется доказать свою позицию. при этом еще издалека: "я-ничего-не-понимаю-в-дс". но это классно, что ты видишь нечто большее. я что-то быстро сдался. утро видимо)))
меня порадовал пассаж про "зачем мне загружать большую модель в gpu, если файл ipynb такой маленький и чудесно помещается в колаб"
источник

D

Den in Natural Language Processing
toriningen
меня порадовал пассаж про "зачем мне загружать большую модель в gpu, если файл ipynb такой маленький и чудесно помещается в колаб"
я уже этот момент объяснил
источник

D

Den in Natural Language Processing
источник

D

Den in Natural Language Processing
такие дела
источник