Size: a a a

Python для анализа данных

2020 November 27

I

Igor in Python для анализа данных
Spearman - ранговая
источник

A

Alexander in Python для анализа данных
Еще вопрос, а есть аналог rank в пандасе, но для строк?
источник

KM

Konstantin Mohov in Python для анализа данных
rank в принципе есть в панде
источник

A

Alexander in Python для анализа данных
но он разве работает со строками?
источник

KM

Konstantin Mohov in Python для анализа данных
по умолчанию axis=0, то есть по индексу ищет
источник

KM

Konstantin Mohov in Python для анализа данных
или ты имеешь ввиду тип данных?
источник

AM

Andrey Matvienko in Python для анализа данных
Чат, привет!
Были ли у кого-нибудь кейсы по распознаванию текстов отзывов?
Пример: есть товар X, его купили и потом написали отрицательный отзыв.
Надо написать скрипт, который по тексту распознает что не так с товаром или доставкой: упаковка/функции/долгая доставка/поломка и т.д.

Если кто-то делал нечто похожее, поделитесь плз
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Andrey Matvienko
Чат, привет!
Были ли у кого-нибудь кейсы по распознаванию текстов отзывов?
Пример: есть товар X, его купили и потом написали отрицательный отзыв.
Надо написать скрипт, который по тексту распознает что не так с товаром или доставкой: упаковка/функции/долгая доставка/поломка и т.д.

Если кто-то делал нечто похожее, поделитесь плз
у пиратов по NLP 2 подробнейших книжки.  на русском. И модельки  можно нагуглить и скачать.

помогло? (разве что морально)
источник

AM

Andrey Matvienko in Python для анализа данных
Pavel Zheltouhov
у пиратов по NLP 2 подробнейших книжки.  на русском. И модельки  можно нагуглить и скачать.

помогло? (разве что морально)
ну пока морально, а теперь читать надо)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
предлагаю подождать когда яндекс за нас все напишет. а там через API  раз-раз.
источник

ND

Natalya Davydova in Python для анализа данных
Привет! Подскажите, пожалуйста, есть ли какие-то другие варианты для анализа влияния категориального фактора на количественный, кроме как построить ящики с усами для каждого значения категориального и сравнить?
источник

R

Ruslan in Python для анализа данных
Не очень понятно по формулировке вопроса. Что именно вы хотите получить от анализа?
источник

R

Ruslan in Python для анализа данных
Анализ ради анализа или есть конкретная цель ?
источник

ND

Natalya Davydova in Python для анализа данных
Есть показатель с вариантами типа "далеко", "близко", "на среднем расстоянии". И есть предположение, что от него зависит измеримый количественный показатель. Мне нужно проверить данную гипотезу.
источник

АМ

Алексей Макаров... in Python для анализа данных
Andrey Matvienko
Чат, привет!
Были ли у кого-нибудь кейсы по распознаванию текстов отзывов?
Пример: есть товар X, его купили и потом написали отрицательный отзыв.
Надо написать скрипт, который по тексту распознает что не так с товаром или доставкой: упаковка/функции/долгая доставка/поломка и т.д.

Если кто-то делал нечто похожее, поделитесь плз
Я бы тут вообще начал с какого-то простого прототипа, опирающегося на наличие ключевых слов в тексте. Это позволит изначально оценить жизнеспособность идеи классифицировать отзывы, потому что вряд ли алгоритм классификации через ML будет с существенно превышающей точностью работать, если не будет работать какая-то простая разметка. По крайней мере, по своему опыту сужу

Ну и потом эта классификация по вхождению будет хорошим началом, чтобы формировать обучающие выборки

Если вы хотите не классификацию делать, а кластеризацию, когда вы не задаёте сначала обучающие выборки, то я бы посмотрел в сторону LDA для начала. Вот статья с примером реализации
источник

AM

Andrey Matvienko in Python для анализа данных
Алексей Макаров
Я бы тут вообще начал с какого-то простого прототипа, опирающегося на наличие ключевых слов в тексте. Это позволит изначально оценить жизнеспособность идеи классифицировать отзывы, потому что вряд ли алгоритм классификации через ML будет с существенно превышающей точностью работать, если не будет работать какая-то простая разметка. По крайней мере, по своему опыту сужу

Ну и потом эта классификация по вхождению будет хорошим началом, чтобы формировать обучающие выборки

Если вы хотите не классификацию делать, а кластеризацию, когда вы не задаёте сначала обучающие выборки, то я бы посмотрел в сторону LDA для начала. Вот статья с примером реализации
Сейчас так и есть, словарик, по которому цикл бегает и если ключ в тексте есть, то алертит значением
источник

AM

Andrey Matvienko in Python для анализа данных
За статью спасибо, изучу
источник

АМ

Алексей Макаров... in Python для анализа данных
Andrey Matvienko
Сейчас так и есть, словарик, по которому цикл бегает и если ключ в тексте есть, то алертит значением
Ну вот если сейчас всё работает сравнительно неплохо и позволяет какие-то решения принимать, то тогда можно попробовать уже с LDA. Посмотреть что будет получатся

А дальше можно и на какие-то word embedding модели посмотреть, например, word2vec. Вот ещё статейка, где можно посмотреть примеры topic modelling с использованием word2vec
источник

AM

Andrey Matvienko in Python для анализа данных
Алексей Макаров
Ну вот если сейчас всё работает сравнительно неплохо и позволяет какие-то решения принимать, то тогда можно попробовать уже с LDA. Посмотреть что будет получатся

А дальше можно и на какие-то word embedding модели посмотреть, например, word2vec. Вот ещё статейка, где можно посмотреть примеры topic modelling с использованием word2vec
Спасибо большое)
источник

АМ

Алексей Макаров... in Python для анализа данных
Andrey Matvienko
Спасибо большое)
👍🏻
источник