Телеграмм чат группы natural_language_processing страница 514

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1279 membersпожаловаться на группу

2019 December 17

ck

cnstntn kndrtv in Natural Language Processing

Раз уж (опять) зашла речь о семантике. Посоветуйте литературу, где описан стройный структурированный подход к семантическому анализу с практическими примерами (на каком-нибудь языке программирования, или хотябы псевдокоде)

источник

15:30пожаловаться #1

YB

Yuri Baburov in Natural Language Processing

Я всегда рекомендую одну по синтаксису :
ЯГ Тестелец введение в общий синтаксис
И две по семантике :
Апресян Модель смысл текст
И
Тузов компьютерная семантика русского языка

источник

15:33пожаловаться #2

Y

Yurii in Natural Language Processing

Я всегда рекомендую одну по синтаксису :
ЯГ Тестелец введение в общий синтаксис
И две по семантике :
Апресян Модель смысл текст
И
Тузов компьютерная семантика русского языка

А для анг?

источник

15:35пожаловаться #3

YB

Yuri Baburov in Natural Language Processing

Мэннинг Журафский ⬆️

источник

15:36пожаловаться #4

YB

Yuri Baburov in Natural Language Processing

Раз уж (опять) зашла речь о семантике. Посоветуйте литературу, где описан стройный структурированный подход к семантическому анализу с практическими примерами (на каком-нибудь языке программирования, или хотябы псевдокоде)

У тестельца кстати семантика тоже затрагивается

источник

15:37пожаловаться #5

YB

Yuri Baburov in Natural Language Processing

Мэннинг Журафский ⬆️

Курс Manning jurafsky,
А книга jurafsky Martin

источник

15:39пожаловаться #6

ck

cnstntn kndrtv in Natural Language Processing

Тузова вроде бы не читал, спасибо. Амперсян, Тестелец вроде больше теоретики. На русском есть Леонтьева - её редко вспоминают, она говорила (писала) что её модель универсальная для всех языков. Знаком с ней, есть её словари, черновики и все её идеи есть в АОТ - вот это практично. АОТ кстати должен, если правильно помню, быть мультиязычным. Но документация к АОТ дается с большим трудом.

источник

15:40пожаловаться #7

YB

Yuri Baburov in Natural Language Processing

Тузова вроде бы не читал, спасибо. Амперсян, Тестелец вроде больше теоретики. На русском есть Леонтьева - её редко вспоминают, она говорила (писала) что её модель универсальная для всех языков. Знаком с ней, есть её словари, черновики и все её идеи есть в АОТ - вот это практично. АОТ кстати должен, если правильно помню, быть мультиязычным. Но документация к АОТ дается с большим трудом.

В AOT слишком много вредных упрощений, например, про именные группы

источник

15:41пожаловаться #8

YB

Yuri Baburov in Natural Language Processing

В AOT слишком много вредных упрощений, например, про именные группы

Просто они хотели грубый линейный проективный парсер на правилах, в 2001 году это было актуально.
Так что теория может и норм, а вот практики с AOT я бы поостерегся

источник

15:42пожаловаться #9

YB

Yuri Baburov in Natural Language Processing

Тузова вроде бы не читал, спасибо. Амперсян, Тестелец вроде больше теоретики. На русском есть Леонтьева - её редко вспоминают, она говорила (писала) что её модель универсальная для всех языков. Знаком с ней, есть её словари, черновики и все её идеи есть в АОТ - вот это практично. АОТ кстати должен, если правильно помню, быть мультиязычным. Но документация к АОТ дается с большим трудом.

Амперсян 🤣 теперь только так и буду его звать, классная опечатка)

источник

15:43пожаловаться #10

ck

cnstntn kndrtv in Natural Language Processing

Амперсян 🤣 теперь только так и буду его звать, классная опечатка)

надеюсь, он не обидится

источник

15:44пожаловаться #11

YB

Yuri Baburov in Natural Language Processing

Я всегда рекомендую одну по синтаксису :
ЯГ Тестелец введение в общий синтаксис
И две по семантике :
Апресян Модель смысл текст
И
Тузов компьютерная семантика русского языка

Тут меня тоже память подвела. Мельчук и Жолковский "модель смысл текст"

источник

15:47пожаловаться #12

ck

cnstntn kndrtv in Natural Language Processing

В AOT слишком много вредных упрощений, например, про именные группы

Чем плохи именные группы? Делаю семанический анализатор, простой (семантика тут - только в понимании заданного RDF-графа). Использую грамматики составляющих. Точнее упрощенный чанкинг. Общая схема - выделить сущности, между ними найти ребра. Какие опасности могут меня ожидать на этом пути?

источник

15:49пожаловаться #13

YB

Yuri Baburov in Natural Language Processing

Чем плохи именные группы? Делаю семанический анализатор, простой (семантика тут - только в понимании заданного RDF-графа). Использую грамматики составляющих. Точнее упрощенный чанкинг. Общая схема - выделить сущности, между ними найти ребра. Какие опасности могут меня ожидать на этом пути?

Точность низкая.

источник

15:50пожаловаться #14

СУ

Сергей Устьянцев in Natural Language Processing

Тут меня тоже память подвела. Мельчук и Жолковский "модель смысл текст"

Апресян всё равно там рядом )

источник

15:51пожаловаться #15

СУ

Сергей Устьянцев in Natural Language Processing

Сорри, Амперсян

источник

15:51пожаловаться #16

YB

Yuri Baburov in Natural Language Processing

Точность низкая.

У них же именная группа -- неразрывная последовательная существительных и прилагательных (не помню, одного падежа или нет?)

источник

15:52пожаловаться #17

ck

cnstntn kndrtv in Natural Language Processing

Точность низкая.

Полнота точно низкая - нужно постоянно правила обновлять. Пока не упрусь в коллизии. Не имея размеченного текста я ничего лучше не придумал.

источник

15:53пожаловаться #18

YB

Yuri Baburov in Natural Language Processing

Полнота точно низкая - нужно постоянно правила обновлять. Пока не упрусь в коллизии. Не имея размеченного текста я ничего лучше не придумал.

А почему не взял готовые элементы?

источник

15:53пожаловаться #19

ck

cnstntn kndrtv in Natural Language Processing

А почему не взял готовые элементы?

А какие? Спрашивал в этом же чате - никто не подсказал.

источник

15:54пожаловаться #20