Size: a a a

Natural Language Processing

2021 May 24

NS

Nikolay V. Shmyrev in Natural Language Processing
Они связаны, без больших данных и большого количества видеокарт качества не будет.
источник

AN

Aydar Nasyrov in Natural Language Processing
Глупый вопрос:
Как подсчитать оптимальный размер батча?
источник

AN

Aydar Nasyrov in Natural Language Processing
В рамках Гугл колаба
источник

DD

David Dale in Natural Language Processing
Оптимальный - это чем больше, тем лучше. Увеличивай, пока memory error не словишь.
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
не всегда, при больших размерах батча часто тяжело найти минимум, надо пробовать на экспериментах или брать, что раньше другими использовалось

https://arxiv.org/abs/1609.04836

resent numerical evidence that supports the view that large-batch methods tend to converge to sharp minimizers of the training and testing functions - and as is well known, sharp minima lead to poorer generalization.
источник

AN

Aydar Nasyrov in Natural Language Processing
«Размер установлен Эмпирическим путём», понял))
источник

NM

Nick Mikhailovsky in Natural Language Processing
В практических применениях любых систем машинного обучения чуть ли не самая важная задача - оценить качество модели на реальных данных. А они обычно не размечены, и сделать эту разметку зачастую невозможно из-за соображений приватности или безопасности. Тем важнее способы оценки качества моделей без использования разметки.

Марина Фомичева (Университет Шеффилда) с соавторами предложила набор подходов к оценке систем машинного перевода без использования разметки. По ее словам: "Большинство современных подходов к автоматической оценке систем генерации естественного языка (NLG) рассматривают оцениваемую модель как черный ящик. В этом выступлении я представлю альтернативный подход, в котором мы заглядывает внутрь модели, чтобы получить представление о качестве сгенерированных выходных данных, на примере нейронного машинного перевода (MT). Благодаря использованию последних достижений в области оценки неопределенности для нейронных сетей, мы предлагаем метод, который не требует дополнительных ресурсов или данных для обучения и в то же время обеспечивает точность, сопоставимую со специализированными системами оценки качества перевода. "

Об этом Марина нам расскажет на очередном вебинаре НТР и HITS ТГУ 25 мая 2021, в 13:00 МСК

Регистрация: https://us02web.zoom.us/webinar/register/2816215991698/WN_eHwwRxWRT7i4LHA_Erxkgg
источник

VM

Victor Maslov in Natural Language Processing
> Та же модель от сбербанка 8 дней на 16 V100 учится

нейросети такие нейросети
источник

A

Andrey in Natural Language Processing
пэйпер есть?
источник

D

Dmitriy in Natural Language Processing
подскажите базовое решение ( для допилить ) под задачу
выделять сущности "субъект, предикат, объект""
   спасибо
PS ruBERT
источник

K

Ksenia in Natural Language Processing
❤️❤️❤️
источник

K

Ksenia in Natural Language Processing
Мне кажется — это https://direct.mit.edu/tacl/article/doi/10.1162/tacl_a_00330/96475/Unsupervised-Quality-Estimation-for-Neural-Machine но из описания не понятно, может что-то более новое
источник

NM

Nick Mikhailovsky in Natural Language Processing
источник

NM

Nick Mikhailovsky in Natural Language Processing
источник

NM

Nick Mikhailovsky in Natural Language Processing
Ага, плюс, надеюсь, что-то новое
источник

K

Ksenia in Natural Language Processing
источник

E

Elena in Natural Language Processing
о, так это твоя научная руководительница?
источник

K

Ksenia in Natural Language Processing
Нет, это моя потенциальная шефиня там, где я рассказывала :)
источник

E

Elena in Natural Language Processing
крутая
источник

K

Ksenia in Natural Language Processing
Я поэтому так страдала над письмом :) и вроде не прогадала
источник