Чат, привет!
Были ли у кого-нибудь кейсы по распознаванию текстов отзывов?
Пример: есть товар X, его купили и потом написали отрицательный отзыв.
Надо написать скрипт, который по тексту распознает что не так с товаром или доставкой: упаковка/функции/долгая доставка/поломка и т.д.
Если кто-то делал нечто похожее, поделитесь плз
Я бы тут вообще начал с какого-то простого прототипа, опирающегося на наличие ключевых слов в тексте. Это позволит изначально оценить жизнеспособность идеи классифицировать отзывы, потому что вряд ли алгоритм классификации через ML будет с существенно превышающей точностью работать, если не будет работать какая-то простая разметка. По крайней мере, по своему опыту сужу
Ну и потом эта классификация по вхождению будет хорошим началом, чтобы формировать обучающие выборки
Если вы хотите не классификацию делать, а кластеризацию, когда вы не задаёте сначала обучающие выборки, то я бы посмотрел в сторону LDA для начала. Вот
статья с примером реализации