Size: a a a

Natural Language Processing

2021 May 25

А

Арсений in Natural Language Processing
Спасибо Константин!!
Уже читаю про UIMA!!!
источник

MS

Misha Stolyar💥 in Natural Language Processing
Всем привет, подскажите как разбить предложение по главным частям речи?

"Вася купил новую машину, а Маша приготовила вкусный обед по рецепту из книги, которую подарила ее любимая бабушка."

Получим три предложения

"Вася купил новую машину"
"а Маша приготовила вкусный обед по рецепту из книги"
"которую подарила ее любимая бабушка"

Пробовал спайси - ну он не находит все корни предложения и уже просто не сделать матчи дочерних слов корня
источник

i

igor in Natural Language Processing
razdel?
источник

MS

Misha Stolyar💥 in Natural Language Processing
Ну сходу посмотрев на библиотеку, то раздел делит по знакам препинания ( по дефолту ) - возможно, если покопаться у него в параметрах, то можно нанять отдел лингвистов и сделать "крокодила" какого-то описав все возможные грамматические случае))))
источник

FF

Futorio Franklin in Natural Language Processing
Пробовали синтаксический парсинг?
источник

MS

Misha Stolyar💥 in Natural Language Processing
Типо создать какой-то матчер, который будет хавать подлежащее сказуемое ( или наоборот ) и все что между ними ( за ) до следующего подлежащего сказуемого ( или кого-то одного )?
источник

FF

Futorio Franklin in Natural Language Processing
Нет, это такой вид парсера, который представляет синтаксическую структуру предложения в виде дерева, по ней можно выделить отдельные структуры
источник

FF

Futorio Franklin in Natural Language Processing
Я очень вольное определение дал поэтому лучше погуглить syntactic parsing
источник

MS

Misha Stolyar💥 in Natural Language Processing
Ну пробовал через спайси, оно как раз такое делает, но в чем проблема - спайси не все корни находит, и тогда ерунда выходит
источник

MS

Misha Stolyar💥 in Natural Language Processing
Пример
источник

MS

Misha Stolyar💥 in Natural Language Processing
источник

DS

Daria Samsonova in Natural Language Processing
попробуйте вот этот парсер

https://stanfordnlp.github.io/CoreNLP/depparse.html
источник

MS

Misha Stolyar💥 in Natural Language Processing
спасибо, сейчас посмотрю
источник

А

Арсений in Natural Language Processing
По поводу UIMA, посмотрел, в общем-то логика работы ясна

Создать интерфейс который возвращает набор объектов, (слова, предложения, сущности, языки и т д), то есть по сути просто набор объектов с тегами, чем объект является "предложением", "ner” или т д    

И все это приходит в итоге из разных источников одной пачкой

Но, вот напрмер, я хочу сделать по всему итоговому набору объектов следующий запрос

"Взять все ner типа "Организация", взять все соседние ner типа "Дата", которые находятся не дальше 3 слов от Организации, и добавить эту дату в свойства Организации, как дату основания этой самой организации.

В таком случае, опять же, могут быть найдены более одной даты рядом с Организацией, либо несколько организаций будут подходить под это условия для данной даты

А требуется взять, например самую ближайшую из стоящих рядом, либо как-то по другому разрешать данную ситуацию, например предоставив пользователю самому переопределить метод, который бы возвращал одну из выделенных сущностей

Также могут быть кейсы, в которых может быть запрошено не только два типа сущностей ("Дату" и "Организацию"), а еще и например типы поставляемых продуктов данной организации.
В таком случае уже появится три группы, каждая из которых может иметь по несколько вариантов сущностей которые стоят рядом.

В UIMA таких функций, не предусмотрено...
источник

А

Арсений in Natural Language Processing
И вот под менеджерингом, я подразумеваю как раз хотя бы возможность осуществлять такие запросы в полученный набор данных

Или автоматическое разрешение таких коллизий на уровне библиотеки
источник

A

Alexandr in Natural Language Processing
Добрый вечер. Подскажите пожалуйста в каком направлении искать. Как посчитать similarity/relevance слова или короткой комбинации слов (жанр/тэг) по отношению к тексту ( ревью фильма / книги)? Интересуют пре-тренированные модели/подходы.
источник
2021 May 26

ЖR

Женя RocketData in Natural Language Processing
Привет. Ребят есть проект по работе с текстом, может у кого-то есть интерес и время? https://freelance.habr.com/tasks/367619
источник

IK

Ilya Kazakov in Natural Language Processing
источник

Е

Егорка in Natural Language Processing
А в чём вопрос ?
источник

ЖR

Женя RocketData in Natural Language Processing
Нельзя постить?
источник