Size: a a a

Machine learning

2020 December 06

US

Ulan Seitkaliyev in Machine learning
вот эти две задачи
источник

US

Ulan Seitkaliyev in Machine learning
источник

DV

Dmitry Vinogradov in Machine learning
У Томского политеха вроде все ясно написано. Все по пунктам про интерполяцию и апроксимацию, с примерами.
источник

DV

Dmitry Vinogradov in Machine learning
источник

DV

Dmitry Vinogradov in Machine learning
Либо я неверно понял вопрос)
источник

GB

Gennady Borisov in Machine learning
Товарищи у меня вопрос. Вводные: Есть много временных рядов с виду похожих друг на друга. Я хочу найти среди них действительно похожие. Какой параметр статистический нужно взять чтобы доказать количественно похожесть временных рядов друг на друга. Корректно ли считать корреляции между ними? Либо есть какие-то другие статистические инструмены?
источник

i

igor in Machine learning
Что значит с виду похожих
источник

GB

Gennady Borisov in Machine learning
igor
Что значит с виду похожих
Визуально, теперь надо проверить правда похожи или нет.
источник

i

igor in Machine learning
Задайте метрику похожести
источник

J

Joy in Machine learning
15 Examples of Machine Learning and Artificial Intelligence in Business

https://upurl.me/4ry4k
источник

DK

Dmitry Kostyrev in Machine learning
источник

GB

Gennady Borisov in Machine learning
igor
Задайте метрику похожести
Вы знаете такую?
источник

i

igor in Machine learning
Их бесконечно много думаю. В определите тут которая согласуется с вашим восприятием
источник

Н

Никита in Machine learning
Добрый день. Хочу провести анализ поведения пользователя на основе взаимодействия с мышкой. Проблема,  не знаю, как можно преобразовать более удобным способом датафрейм.  1 строка- 1 сессия , в столбце sessions показаны все действия в рамках этой сессии, как мне их лучше распарсить?
источник

AR

Anton Rogozin in Machine learning
Никита
Добрый день. Хочу провести анализ поведения пользователя на основе взаимодействия с мышкой. Проблема,  не знаю, как можно преобразовать более удобным способом датафрейм.  1 строка- 1 сессия , в столбце sessions показаны все действия в рамках этой сессии, как мне их лучше распарсить?
Можно сделать так: первый столбец содержит id пользователя, второй и третий столбцы - координаты мышки. В итоге получится что-то в духе:

|id|x|y|type|time|
|1|450|2000|mousemove|2020-08-11 10:40|
|1|420|2100|mousemove|2020-08-11 10:42|

Думаю, так будет удобнее делать срезы по датафрейму, гистограммы или карту, где чаще всего была мышка
источник

Н

Никита in Machine learning
Тоже только это придумал:
Если так делать, то обработку df в любом случае через цикл проводить ?
источник

AR

Anton Rogozin in Machine learning
Никита
Тоже только это придумал:
Если так делать, то обработку df в любом случае через цикл проводить ?
Хм, скорее всего да, так как структура словаря в столбце особая
источник

АГ

Артём Глазунов... in Machine learning
Gennady Borisov
Товарищи у меня вопрос. Вводные: Есть много временных рядов с виду похожих друг на друга. Я хочу найти среди них действительно похожие. Какой параметр статистический нужно взять чтобы доказать количественно похожесть временных рядов друг на друга. Корректно ли считать корреляции между ними? Либо есть какие-то другие статистические инструмены?
у меня в свое время получилось неплохо кластеризовать ряды с помощью агломеративной кластеризации. Но, тут нужно сначала отнормировать значения рядов на 1(чтобы можно было сравнивать и строить на плоскости), выделить временной промежуток ( я брал месяц (24*30 точек) и вырезать соответствующие фрагменты (если использовать всю длину, то может негативно сказаться "проклятье размерности", слишком много координат для евклидова расстояния, я брал 30 точен). Далее я просто находил центры кластеров через усреднение, а качество построенных кластеров смотрел визуально, изображая все фрагменты на плоскости. Проверял по суммарному расстоянию от центра кластера и среднему расстоянию от центра. Количество кластеров изначально прикинул через elbow rule и коэффициент силуэта (посмотрите библиотеку yellowbrick). Довольно быстро удалось сгруппировать ряды по степени похожести, выделить наиболее похожие.
источник

АГ

Артём Глазунов... in Machine learning
типа этого получалось
источник

АГ

Артём Глазунов... in Machine learning
жирным это центр кластера
источник