Size: a a a

Natural Language Processing

2019 November 25

V

Vic in Natural Language Processing
Yuri Baburov
ну или fastapi какой-нибудь (+pydantic)
👍
источник
2019 November 26

YS

Yehor Smoliakov in Natural Language Processing
Всем привет. Нужен совет: какой инструмент лучше использовать для получения языка сообщения в мессенджерах? Я сейчас использую https://github.com/indix/whatthelang но он делает ошибки или вообще не может адекватно дать ответ (нужно еще, видимо, записывать процент уверенности в предсказании). Пример можно на видео увидеть.
источник

YS

Yehor Smoliakov in Natural Language Processing
источник

AC

Alexander C in Natural Language Processing
Коллеги, привет. Где описано negative sampling в word2vec ? Так чтоб кратко и понятно?
источник

AC

Alexander C in Natural Language Processing
(Теория, формулы)
источник

SZ

Sergey Zakharov in Natural Language Processing
источник
2019 November 27

EE

Elizaveta Ershova in Natural Language Processing
Yehor Smoliakov
Всем привет. Нужен совет: какой инструмент лучше использовать для получения языка сообщения в мессенджерах? Я сейчас использую https://github.com/indix/whatthelang но он делает ошибки или вообще не может адекватно дать ответ (нужно еще, видимо, записывать процент уверенности в предсказании). Пример можно на видео увидеть.
привет, есть библиотека langdetect от гугла https://pypi.org/project/langdetect/
источник

YS

Yehor Smoliakov in Natural Language Processing
Тоже пробовал её. Там посимвольно идёт сравнение.
источник

AK

Anton Kiselëv in Natural Language Processing
Yehor Smoliakov
Тоже пробовал её. Там посимвольно идёт сравнение.
источник

AK

Anton Kiselëv in Natural Language Processing
Есть моделька fasttext, можно ее попробовать
источник

YS

Yehor Smoliakov in Natural Language Processing
whatthelang именно на ней и работает
источник

V

Vlad in Natural Language Processing
источник

AK

Anton Kiselëv in Natural Language Processing
Yehor Smoliakov
whatthelang именно на ней и работает
он на маленькой работает, а по ссылке выше есть еще полная версия
источник

V

Vlad in Natural Language Processing
Только надо знать, что langdetect и langid очень плохо работают, когда на входе 1-2-3 слова всего. Если заранее известен перечень возможных языков - лучше указать их при использовании, так будет по лучше работать
источник

YS

Yehor Smoliakov in Natural Language Processing
Anton Kiselëv
он на маленькой работает, а по ссылке выше есть еще полная версия
Ок, попробую с большой
источник

RG

Roman G in Natural Language Processing
Народ, добрый день. Есть набор из 300тыс строк (названия тмц), Строки разложенны по группам. Для каждой группы свои правила/шаблоны для названий. Нужно на основе уже имеющихся строк выводить подсказку при вводе новой строки. Подскажите примеры /технологии.
источник

A

Aragaer in Natural Language Processing
обучить посимвольную rnn
источник

R

Roman in Natural Language Processing
Roman G
Народ, добрый день. Есть набор из 300тыс строк (названия тмц), Строки разложенны по группам. Для каждой группы свои правила/шаблоны для названий. Нужно на основе уже имеющихся строк выводить подсказку при вводе новой строки. Подскажите примеры /технологии.
Elasticsearch completion-suggester
источник

V

Vic in Natural Language Processing
Yehor Smoliakov
Всем привет. Нужен совет: какой инструмент лучше использовать для получения языка сообщения в мессенджерах? Я сейчас использую https://github.com/indix/whatthelang но он делает ошибки или вообще не может адекватно дать ответ (нужно еще, видимо, записывать процент уверенности в предсказании). Пример можно на видео увидеть.
Есть еще polyglot либа
источник

YP

Yaroslav Pikaliov in Natural Language Processing
Yehor Smoliakov
Всем привет. Нужен совет: какой инструмент лучше использовать для получения языка сообщения в мессенджерах? Я сейчас использую https://github.com/indix/whatthelang но он делает ошибки или вообще не может адекватно дать ответ (нужно еще, видимо, записывать процент уверенности в предсказании). Пример можно на видео увидеть.
источник