Size: a a a

Natural Language Processing

2021 June 18

o

oldysty in Natural Language Processing
Всем привет. Загрузил модель из transformers и подложил в нее свои веса из дикта, не хватило несколько параметров. Использовал strict=False, Теперь результат при запуске на одних и тех же данных разный каждый раз. Что это может быть? Модель не перезагружал.
источник

DD

David Dale in Natural Language Processing
Ты сделал model.eval() перед инференсом?
Возможно, результаты разные просто потому, что дропаут не выключен.
источник

SancheZz Мов in Natural Language Processing
Вполне возможно что дропаут работает реал
источник

o

oldysty in Natural Language Processing
Пойду посыпать голову пеплом. Спасибо.
источник

o

oldysty in Natural Language Processing
Да, это был он
источник

ИГ

Ильнур Гарипов... in Natural Language Processing
Добрый день. Подскажите, может ли IOB tagging положительно повлиять на качество модели или она нужна только для того чтобы две одинаковые NE не слились в одну?
источник
2021 June 19

D

Dmitriy in Natural Language Processing
неверно
`
image_to_boxes Returns result containing recognized characters and their box boundaries
image_to_data Returns result containing box boundaries, confidences, and other information. Requires Tesseract 3.05+. For more information, please check the Tesseract TSV documentation
`
источник

GF

Grigory Frantsuzov in Natural Language Processing
Да, я уже нашел когда коллега подсказал что это возможно
источник

K

Ksenia in Natural Language Processing
Всем привет, кто-нибудь пользовался BingTranslator либой и API? Есть где-нибудь короткое объяснение, как получить client_id и client_secret отсюда https://github.com/wilfilho/BingTranslator ? Такое объяснение, которое не требует 44 минут для прочтения, как в микрософтовских доках
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
источник

$

$○| in Natural Language Processing
В Vosk каким-то образом можно распознавать английские слова среди русcкой речи?
источник

$

$○| in Natural Language Processing
Хотя бы выделять их как-то что они есть и распознавать чем то другим эту фразу
источник

K

Ksenia in Natural Language Processing
Ага, спасибо... в микрософте все очень юзер-френдли, конечно
источник

V

Vasiliy in Natural Language Processing
Всем привет!
Прочитал в блоге гугла запись Extracting Structured Data from Templatic Documents  https://ai.googleblog.com/2020/06/extracting-structured-data-from.html и сам папир. Очень интересно. Кто-то видел примеры-имплементации описанной схемы, или для другой, но похожей задачи (по каким ключевым словам гуглить)?
источник

VM

Victor Maslov in Natural Language Processing
/me в свое время для селениум-тестирования делал распознавалку структуры страниц сайта, таблички, выявление, какие элементы текста являются подписями полей форм, рекурсивное горизонтально-вертикальное разбиение на секции и т.п. -- помогало избавиться от проблем того, что верстальщики периодически все переверстывают и костылят
источник

DM

Dmitry Malkov in Natural Language Processing
some
источник
2021 June 20

АЖ

Антон Жиянов... in Natural Language Processing
Кто чем пользуется для обучения моделей в облаке? Обычный Colab постоянно отваливается, а Colab Pro в России недоступен (ಠ_ಠ)
источник

A

Andrey in Natural Language Processing
03222 zip code без налогов. но сильно на него тоже не рассчитывайте
источник

АЖ

Антон Жиянов... in Natural Language Processing
В смысле достаточно указать правильный зип-код, и колаб про заработает? А страну карточки он разве не проверяет?
источник

A

Andrey in Natural Language Processing
для РФ можно пользоваться
источник