Size: a a a

Конкурсы Telegram

2019 November 24

VZ

Vladimir Zhuravlev in Конкурсы Telegram
See All
тут даже обычный kmeans подойдет, без суперсложностей
Спс. Про kmeans слышал, но с кластеризацией не работал детально.
источник

VZ

Vladimir Zhuravlev in Конкурсы Telegram
Если так, то ок
источник

НК

Николай Карпенко in Конкурсы Telegram
да жопа это все
источник

VZ

Vladimir Zhuravlev in Конкурсы Telegram
Николай Карпенко
да жопа это все
А что лучше?
источник

VZ

Vladimir Zhuravlev in Конкурсы Telegram
😒
источник

SA

See All in Конкурсы Telegram
Николай Карпенко
да жопа это все
итак, и что же
источник

НК

Николай Карпенко in Конкурсы Telegram
нас загоняют в рамки таких алгоритмов. но какой смысл, если эти тупые алгоритмы делают быстро, но с ошибками 60-70%, а более умные и точные алгоритмы на порядок дольше работают.
источник

SA

See All in Конкурсы Telegram
так все, можно ливать с соревы чи шо
источник

НК

Николай Карпенко in Конкурсы Telegram
сгруппировать по сюжетам можно и по частоте слов со стемом и прочими коэффициентами, kmeans туда же. Путин то, Путин это сольются,  Путин в Сирии и Путин в культуре скорее всего не отличаться, и будут как сюжет один. Группировка у яндекса неплохо работает, как эталон. Уверен это далеко за пределами 1000 файлов за 60, и без опоры на прошлые анализы. Определено игнор тематики новости при группе в сюжеты не адекватно. Также нужно NER и POS, а это все затраты времени.
источник

НК

Николай Карпенко in Конкурсы Telegram
отсутствие эталона в конкурсе делает его субьективным, а критерий скорости убивает стремления к качеству, ибо любая хорошая скорость в этом корпусе будет иметь нулевую ценность, когда речь пойдёт о продакшн точности.
источник

SA

See All in Конкурсы Telegram
Николай Карпенко
сгруппировать по сюжетам можно и по частоте слов со стемом и прочими коэффициентами, kmeans туда же. Путин то, Путин это сольются,  Путин в Сирии и Путин в культуре скорее всего не отличаться, и будут как сюжет один. Группировка у яндекса неплохо работает, как эталон. Уверен это далеко за пределами 1000 файлов за 60, и без опоры на прошлые анализы. Определено игнор тематики новости при группе в сюжеты не адекватно. Также нужно NER и POS, а это все затраты времени.
источник

SA

See All in Конкурсы Telegram
ну да
источник

s

sorrge in Конкурсы Telegram
«Я не могу сделать хорошо, значит это невозможно»
источник

НК

Николай Карпенко in Конкурсы Telegram
Не, просто все, что можно предложить в рамках конкурса это будет велосипед, который условно изобрели уже до нас. никаких инноваций не требуется. никаких требований к качеству это настораживает. даже определение языка сейчас на уровне 90% с + у многих библиотек. Об этом ни слова в конкурсе. критерии сюжет весьма разнообразные, об этом тоже ни слова, ибо нет эталонов. каждый из нас делает чёрный ящик, который может совпадать с чёрным ящиком тестировщика и его уровня понимая проблематики.
условно говоря алгоритм кого-то из нас может быть медленнее, но на порядок качественнее и его пошлют, ибо не фиг дольше.
источник

SA

See All in Конкурсы Telegram
Николай Карпенко
Не, просто все, что можно предложить в рамках конкурса это будет велосипед, который условно изобрели уже до нас. никаких инноваций не требуется. никаких требований к качеству это настораживает. даже определение языка сейчас на уровне 90% с + у многих библиотек. Об этом ни слова в конкурсе. критерии сюжет весьма разнообразные, об этом тоже ни слова, ибо нет эталонов. каждый из нас делает чёрный ящик, который может совпадать с чёрным ящиком тестировщика и его уровня понимая проблематики.
условно говоря алгоритм кого-то из нас может быть медленнее, но на порядок качественнее и его пошлют, ибо не фиг дольше.
о вреени все быи на берегу предупреждены, тащемто
источник

SA

See All in Конкурсы Telegram
суперкачества никто не требует
источник

s

sorrge in Конкурсы Telegram
На конкурсах никогда не изобретают прям новые методы
источник

ДП

Дмитрий Павлов in Конкурсы Telegram
Николай Карпенко
отсутствие эталона в конкурсе делает его субьективным, а критерий скорости убивает стремления к качеству, ибо любая хорошая скорость в этом корпусе будет иметь нулевую ценность, когда речь пойдёт о продакшн точности.
Вообще есть кое-что интересное и достаточно скоростное, учитывающее субъективизм. Если интересно - могу после контеста ссылку скинуть
источник

s

sorrge in Конкурсы Telegram
Качество, очевидно, будет учитываться. То, что неизвестно, как именно это и плюс и минус
источник

s

sorrge in Конкурсы Telegram
Плюс - есть свобода интерпретации. Лично мне это нравится
источник