Size: a a a

Конкурсы Telegram

2019 November 25

SA

See All in Конкурсы Telegram
а вот интересно, Короткевич решает АСМ, а на работе от него ждут решения других задач. Во тупые, а
источник

SA

See All in Конкурсы Telegram
проверить нормально не могут
источник

НК

Николай Карпенко in Конкурсы Telegram
я к тому, что они делают приложение, требующих стайеров, а тест и оценки делают для спринтеров. в этом радикальное несогласие с организаторами.
источник

SA

See All in Конкурсы Telegram
ну ты можешь давать фидбек не тут, где его никто не оценит и не услвшит, а отправить в специального бота для сбора мнений
источник

SA

See All in Конкурсы Telegram
в рамках этого контеста Маркус ни разу не триггернулся(
источник

SA

See All in Конкурсы Telegram
нене, я исключительно про этот
источник

SA

See All in Конкурсы Telegram
то, что он в чате на войп отвечал - я видел по итсории9
источник

AA

Artem A in Конкурсы Telegram
Ну это же соревнование по анализу данных) Видимо надо извлекать смысл и из задания)
источник

s

sorrge in Конкурсы Telegram
Делаю группировку. Дофига статей по одному событию в датасетах
источник

s

sorrge in Конкурсы Telegram
Пожалуй, почти все новости дублируются
источник

s

sorrge in Конкурсы Telegram
Часто 10+ вижу
источник

s

sorrge in Конкурсы Telegram
Если идея в том, чтобы ленту новостей какую-то делать из этого, группировка совершенно необходима
источник

QZ

Q Z in Конкурсы Telegram
sorrge
Часто 10+ вижу
А это на каком количестве новостей? У меня на первых 1к получилось ~15 событий. Ну и не настолько заполненных. Есть подозрение что костыль неверно написал🤔
источник

QZ

Q Z in Конкурсы Telegram
На первых 1к англ*
источник

QZ

Q Z in Конкурсы Telegram
Ну в плане отсеял 1к. Остались англ и применил
источник

НК

Николай Карпенко in Конкурсы Telegram
У сюжетов две проблемы

1.Есть дубли, когда одна и та же новость копируется с рерайтом на разных СМИ день в день или через день. Это копирование не несет новой информации.

2. Каждый день даже на одном СМИ может выходить новость на одну тему - например, ликвидация наводнения Иркутске. Содержание этих новостей может сильно отличаться, как по обьему текста, так и по содержанию.
И вот просто отсеять дубли и действительно новые данные по теме нетривиально. И простыми алгоритмами вообще легко спутать в одну группу наводнение в Иркутске и в каком-то другом городе или стране.
источник

ДП

Дмитрий Павлов in Конкурсы Telegram
Николай Карпенко
У сюжетов две проблемы

1.Есть дубли, когда одна и та же новость копируется с рерайтом на разных СМИ день в день или через день. Это копирование не несет новой информации.

2. Каждый день даже на одном СМИ может выходить новость на одну тему - например, ликвидация наводнения Иркутске. Содержание этих новостей может сильно отличаться, как по обьему текста, так и по содержанию.
И вот просто отсеять дубли и действительно новые данные по теме нетривиально. И простыми алгоритмами вообще легко спутать в одну группу наводнение в Иркутске и в каком-то другом городе или стране.
По п. 1 вам не требуется избавляться от дублей. Нет такой задачи.
По п. 2 не ясно зачем вообще нужно учитывать объем текста. А наводнение а Иркутске и другом городе все же один инфоповод, называется наводнения в мире. Можно и так интерпретировать. Уверен, есть те, кто этим интересуется. Так что все нормально, вроде
источник

НК

Николай Карпенко in Конкурсы Telegram
Ага вот вы указали на третью особенность, сюжетов может быть множество у одних и тех  же новостей.
источник

НК

Николай Карпенко in Конкурсы Telegram
Думаю вам будет не интересно открывать новости Москвы и видеть сообщения о пожарах по всему миру, ибо агрегатор так сюжет построил 😁
источник

Y💜

Yuri ♂️ 💜 Ly in Конкурсы Telegram
Николай Карпенко
Думаю вам будет не интересно открывать новости Москвы и видеть сообщения о пожарах по всему миру, ибо агрегатор так сюжет построил 😁
Если ты можешь этого избежать, то сделай. Но задача этого не требует и никто не говорил, что продукт победителя будут сразу в таком виде использовать или вообще будут.
источник