Size: a a a

Natural Language Processing

2021 September 07

SancheZz Мов in Natural Language Processing
Ну на тпу можно вполне обучиться успеть
источник

SancheZz Мов in Natural Language Processing
Как на каггл так и на колабе
источник

SancheZz Мов in Natural Language Processing
Конечно уровня bert-base, electra base/middle
источник

A

Arthur in Natural Language Processing
Кто-нибудь применял на практике efficient transformers (которые для длинных последовательностей - longformer, bigbird, etc)? В каких задачах (кроме работы с ДНК/РНК) они действительно полезны и не обойтись разбиением на несколько небольших последовательностей и агрегацией?
источник

AM

Aleksandr Mester in Natural Language Processing
Ребят, а кто-нибудь знает модели по извлечению noun chunks на русском? Есть чего?
источник

A

Andrei in Natural Language Processing
spacy-ru вроде умеет, видел тетрадки у @yuri_baburov
источник

M

MAB in Natural Language Processing
Подскажите, пожалуйста, чем лучше всего исправить опечатки в русском языке? (не yandex speller), важно не обрабатывать на стороннем сервере.
источник

AE

Anton Eryomin in Natural Language Processing
мне кажется Word довольно неплохо это дело делает
источник

A

Andrey in Natural Language Processing
jamspell, autocorrect, еще есть разные
источник

М

Марк in Natural Language Processing
Применял longformer. Действительно работает быстрее. По метрикам качества не сравнивал, но нужного в задаче качества добиться удалось
источник

YB

Yuri Baburov in Natural Language Processing
сделай нормализацию юникода. до нормализации "й" может быть записана как "и◌̆" и как "й" (ё тоже может быть записано как е¨, но такое намного реже встречается) . Особенно любил это делать макос в именах файлов почему-то.
https://stackoverflow.com/a/16467505
источник

N

Nikolay in Natural Language Processing
Как создавать обучающие данные формата .spacy? Есть для этого готовые либы какие-нибудь?
источник

N

Nikolay in Natural Language Processing
источник

AW

Alex Wortega in Natural Language Processing
Hostkey
источник

D

Dmitry in Natural Language Processing
Спасибо! Про vast.ai не слышал, но вижу что уже второй человек тут использует. Попробую.
источник

N

Nikolay in Natural Language Processing
только не оставляйте на истансах полученные результаты надолго. инстансы иногда отваливаются сами по себе
источник

D

Dmitry in Natural Language Processing
Ого, спасибо за предупреждение!)
источник

SS

Shivashis Swain in Natural Language Processing
Can anyone suggest multilingual test data
источник

SancheZz Мов in Natural Language Processing
XNLI dataset
источник

SS

Shivashis Swain in Natural Language Processing
For language detection purpose
источник