Size: a a a

Natural Language Processing

2021 April 14

N

Natalia in Natural Language Processing
русского варианта курса?
источник

A

Alexander in Natural Language Processing
Да. Для быстрого старта, так сказать.
источник

N

Natalia in Natural Language Processing
я вообще за языковое разнообразие всей душой, но искренне недоумеваю, почему материалы на английском так смущают. всё равно все команды на нём, документация на нём, не избежать английского
источник

VS

Vladislav Shufinskiy in Natural Language Processing
Курс для начинающих, спокойно проходится и понимается при помощи яндекс.переводчика или google translate. Сам так проходил
источник

MK

Max Kuznetsov in Natural Language Processing
Если пилишь продукт для российского рынка, то нафига документация на английском? Особенно для какой-нибудь специфической предметной области? Я имена переменных в качестве эксперимента делал русские, читаемость кода повысилась.
источник

FF

Futorio Franklin in Natural Language Processing
1с 👍
источник

AY

Alexander Yamoldin in Natural Language Processing
Подскажите пожалуйста, я немного запутался
У меня есть текс в котором есть имена собственные, аббревиатуры, названия.
Чтобы обучить сеть (DeepPavlov NER) мне нужно сначала разметить текст, чтобы сделать датасет?
Это задача Bert?
А потом уже подавать на вход сети размеченный датасет?

Что-то я запутался
источник

N

Natalia in Natural Language Processing
речь была про spacy, это для российского рынка?
источник

N

Natalia in Natural Language Processing
и да, вы не представляете, но иногда люди из других стран тоже имеют дело с русскими данными, но зачем делать всё доступней, действительно, это только в сторону "а чё не на русском" работает
источник

N

Natalia in Natural Language Processing
а вы хотите прямо свою обучать, а не взять готовую посмотреть для начала?
источник

MK

Max Kuznetsov in Natural Language Processing
А я понял про "все команды разработчиков" 😭 конечно знать язык для чтения документации нужно обязательно.
источник

AY

Alexander Yamoldin in Natural Language Processing
Ну я первый раз с текстом работаю. По заданию у меня есть два датасета, один train другой test
Получается что от меня ждут обучение сети
источник

N

Natalia in Natural Language Processing
но при этом ничего не размечено? (по предыдущей реплике так показалось)

просто пока звучит расплывчато
источник

MK

Max Kuznetsov in Natural Language Processing
"иногда", ради "иногда" терять простоту и ясность, которую получаешь используя родной язык. Проще перевести, то что необходимо, когда кому-то потребуется, чем заранее готовиться и "не пригодилась" ©
источник

N

Natalia in Natural Language Processing
не про все :) понятно, что для внутренней кухни и вообще можно писать как угодно. но всё равно ж все команды по-английски и т.п., я про это ещё (что всё равно есть соприкасание с английским по дефолту)
источник

MK

Max Kuznetsov in Natural Language Processing
Вот у меня дилемма, назвать метод get_adopting_bodies или get_принявшие_органы или получить_принявший_орган, как не сделай получается фигня (
источник

N

Natalia in Natural Language Processing
а что, раскладку переключать не бесит?
источник

N

Natalia in Natural Language Processing
тут же вопрос экономии усилий в том числе
источник

AY

Alexander Yamoldin in Natural Language Processing
Ну да, грубо говоря, в одном датасете юр лица , в тестовом датасете тоже юр лица, но другие и капслоком написаны
Нужно перевести в правильный регистр, т.е. учитывать что аббревиатуры большими буквами, имена собственные с большой буквы, все остальное с маленькой
источник

AY

Alexander Yamoldin in Natural Language Processing
Думал, что это задача ner по определению сущностей, что из них название, что аббревиатура, что имя, а что просто текст
источник