И на первый взгляд все понятно - первое слагаемое соотвествует нужному аутпуту, а следующая сумма из штук 5 слагаемых соответствует негативным семплам.
Но в отличие от начального случая у нас тут уже два вида эмбеддингов - для инпута (v на картинке), и для аутпута (u на картинке). Вопрос - а зачем вообще делать два эмбеддинга? Почему нельзя оставить одинаковые для входящих и для исходящих?
Друзья, кто знает тулзу или датасет для изменения вида глагола? Нужно что-то, позволяющее легко превращать, например, "переводить" в "перевести" и обратно.
Друзья, кто знает тулзу или датасет для изменения вида глагола? Нужно что-то, позволяющее легко превращать, например, "переводить" в "перевести" и обратно.
Уууу Могу предложить хак — лемматизировать майстемом или пайморфи соответственно, майстем правда не очень последовательно лемматизирует в этом месте, но какое-то качество будет