Телеграмм чат группы natural_language

Концептуально то же самое. Веса от Transformers можно загрузить, но надо конвертировать. В Slovnet используется стандартный TransformerEncoderLayer из PyTorch. Когда писали Transformers его не было

источник

18:36пожаловаться #7

Anton Kolonin in Natural Language Processing

Если админы не сочтут за спам (а если сочтут, то просьба ограничиться предупреждением и сносом поста), то для опытного пользования предлагается графовая аналитика взаимодействий в группах в Телеграм - включая эту группу - описано тут: https://blog.singularitynet.io/reputation-system-in-aigents-supporting-telegram-groups-and-more-c43f0cf5053d (анализируется только характер и интенсивность взаимодействий без сентимента - про сентименит я отдельно постил тут раньше). Фидбек можно в личку 😊

Medium

Reputation System in Aigents® supporting Telegram Groups and more

The latest Aigents 2.3.6 release brings it forward to the next level — Telegram Aigents Bot.

источник

18:36пожаловаться #8

Alexander Kukushkin in Natural Language Processing

Правда может быть проблема в том что в Slovnet по совету Roberta не использует input с типом токена token_type_ids

источник

18:38пожаловаться #9

Mikhail Tikhomirov in Natural Language Processing

Alexander Kukushkin

Конвертация иногда может представлять не простую задачу xD
Спасибо за ответы!

источник

18:38пожаловаться #10

Mikhail Tikhomirov in Natural Language Processing

Alexander Kukushkin

Правда может быть проблема в том что в Slovnet по совету Roberta не использует input с типом токена token_type_ids

О, а его я использовал, хм, буду иметь в виду

источник

18:39пожаловаться #11

Mikhail Tikhomirov in Natural Language Processing

Кстати, для NER берт морозился?

источник

18:41пожаловаться #12

Alexander Kukushkin in Natural Language Processing

Эмбединги да, энкодер нет

источник

18:45пожаловаться #13

Mikhail Tikhomirov in Natural Language Processing

Кстати, раз в Вашей реализации нет token_type_ids, то как Вы конвертили и запускали RuBERT? Он же обучался с использованием этих токенов. Или данные по качеству взяты от deeppavlov?

источник

18:49пожаловаться #14

Alexander Kukushkin in Natural Language Processing

Ковертируем вместе с token_type_ids, выковыриваем веса с эмбедингами token_type_ids, дообучаем, получается NewsRuBert

Когда давно давно использовал чистый RuBERT, передовал token_type_ids

источник

18:56пожаловаться #15

Mikhail Tikhomirov in Natural Language Processing

Понял, спасибо :)

источник

19:01пожаловаться #16

Mikhail Tikhomirov in Natural Language Processing

Для воспроизведения видимо необходимо иметь AWS акк, правильно? Для того, чтобы скачать данные

источник

19:03пожаловаться #17

Mikhail Tikhomirov in Natural Language Processing

Или есть другой способ получить данные, без регистрации?