Телеграмм чат группы natural_language

20:06пожаловаться #1

Keras extending embedding layer input

Ilya

Добрый вечер! Нужен совет по эмбедингам в керасе. Вот, собственно, формулировка:
https://stackoverflow.com/questions/54551316/keras-extending-embedding-layer-input
Как можно расширить (наследовать) существующие эмбединги?

Подозреваю, что только переобучивать

Stack Overflow

A keras sequential model with embedding needs to be retrained starting from the currently known weights.

A Keras sequential model is trained on the provided (text) training data. The training data...

я умею в эмбеддинг слои кераса заливать просто нумпи массив весов

21:25пожаловаться #2

соответственно если взять новый размер, в него засунуть значения старого, а остальное рандом, то вот оно и есть

21:26пожаловаться #3

Ilya in Natural Language Processing

Т.е. просто для новых токенов в матрицу добавить новые столбцы?

21:27пожаловаться #4

https://github.com/aragaer/human2pa/blob/char/char-train.py#L112 - собственно вот, веса для первого слоя я храню отдельно от всей остальной модели и вот как раз код "загрузить файл весов эмбеддинг слоя и засунуть его"

Contribute to aragaer/human2pa development by creating an account on GitHub.

aragaer/human2pa

21:27пожаловаться #5

ну я не знаю как "добавить новые столбцы", я бы просто создал новый массив нужного размера, в него скопировал старое через срез

21:28пожаловаться #6

Ilya in Natural Language Processing

Ну да. Спасибо за идею

Rinat Valiullov in Natural Language Processing

21:29пожаловаться #7

2019 December 12

https://github.com/microsoft/nlp-recipes

Natural Language Processing Best Practices & Examples - microsoft/nlp-recipes

microsoft/nlp-recipes

20:13пожаловаться #8

спасибо за наводку на flair, что-то получается

Sergey Bilenko in Natural Language Processing

22:50пожаловаться #9

2019 December 13

Парни, не подскажете, гугловский BERT, который на Гитхабе ( https://github.com/google-research/bert ) как с русским языком дружит? Пишут, что в BERT недавно большое русскоязычное обновление подвезли:
https://3dnews.ru/999350/?future-link
Но в opensource его, судя по комитам, не выложили

TensorFlow code and pre-trained models for BERT. Contribute to google-research/bert development by creating an account on GitHub.

google-research/bert

Denis Kirjanov in Natural Language Processing

11:45пожаловаться #10

Sergey Bilenko

TensorFlow code and pre-trained models for BERT. Contribute to google-research/bert development by creating an account on GitHub.

google-research/bert

По-моему они просто выкатили берт в поиск, а авторы новости хайпанули на том, что именно запросы на русском тоже обрабатываются бертом

11:46пожаловаться #11

кто-то сравнивал gpt-2 и bert для задач генерации текстов?

Nikolay Shmyrev in Natural Language Processing

12:04пожаловаться #12

Alex Surname

кто-то сравнивал gpt-2 и bert для задач генерации текстов?

Тут и сравнивать не надо, gpt-2 лучше так как для этого предназначена. А берт так, сборная солянка, максимум NER можно делать.

12:06пожаловаться #13

а берт на каких задачах выигрывает?

12:07пожаловаться #14

про сборную солянку не совсем понял, с точки зрения архитектуры системы системы подобны

Nikolay Shmyrev in Natural Language Processing

12:07пожаловаться #15

Целевая функция разная.

12:08пожаловаться #16

https://ai.stackexchange.com/questions/9141/can-bert-be-used-for-sentence-generating-tasks

Artificial Intelligence Stack Exchange

Can BERT be used for sentence generating tasks?

I am a new learner in NLP. I am interested in the sentence generating task. As far as I am concerned, one state-of-the-art method is the CharRNN, which uses RNN to generate a sequence of words.

Ho...

cnstntn kndrtv in Natural Language Processing

12:25пожаловаться #17

Привет. Встречал ли кто-то подобные правила для перевода утверждений в булевую логику? Чтобы самому не писать. Тут функции - предикаты (все возвращают True)
собака лает --> лает(собака)
каждая собака лает --> all([ лает(c) for c in Sobakas ])
сабака или лает или воет --> or(лает(собака), воет(собака))
больше половины собак лает --> len([ лает(с) for c in Собаки ]) > len(Собаки)/2
только одна собака мяукает --> len([ мяукает(с) for c in Собаки ]) == 1
Не в такой псевдопитон конечно, в какую-нибудь логику первого порядка. Не важно в общем то в каком виде результат.

13:21пожаловаться #18

Anton K. in Natural Language Processing

sobakas! 🙂

cnstntn kndrtv in Natural Language Processing

13:22пожаловаться #19

Shutkas