Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2020 August 27

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ребят, подскажите , есть русскоязычный туториал по statmodels библиотеке ?
источник

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Хотите увидеть неудачную попытку deepfake ?
источник

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

AB

Arcady Balandin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

R

Runtime Еггор in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
шедевр
источник

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Что получается когда объединяешь противоположности. Илона и Алишера
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Переслано от k k
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ребят, а что значат эти красные признаки в eli5 (библиотека для отбора признаков) ? Я прочитал, вроде случайно оказалась модель точнее при их перестановке, да? Но они ведь не нужны ? Мне нужно оставить только зеленные признаки , да?
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
И можно ли eli5 параллельно считать ?
источник

D

Dima🐼 in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Колонка event_name принимает 4 значения (install, lvl_3_reached, lvl_5_reached, npu), я хочу внутри этого аггрегейта посчитать количество lvl_reached_3, lvl_reached_5 для каждой группы. Как мне это сделать ?)

пример:

site_id    capmaign    event_name
A               X                    lvl_reached_3
A               X                    lvl_reached_3
A               X                    lvl_reached_5
A               Y                    lvl_reached_3
B               Y                    lvl_reached_5
B               Y                    lvl_reached_5

и должно выйти что-то такое:

site_id   capmaign   lvl_3_counts    lvl_5_counts
A              X                  2                           1
A              Y                  1                           0
B              Y                  0                           2
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ребят, как узнать сколько времени борута будет признаки отбирать ?
источник

MC

Maxim Cheparin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Dima🐼
Колонка event_name принимает 4 значения (install, lvl_3_reached, lvl_5_reached, npu), я хочу внутри этого аггрегейта посчитать количество lvl_reached_3, lvl_reached_5 для каждой группы. Как мне это сделать ?)

пример:

site_id    capmaign    event_name
A               X                    lvl_reached_3
A               X                    lvl_reached_3
A               X                    lvl_reached_5
A               Y                    lvl_reached_3
B               Y                    lvl_reached_5
B               Y                    lvl_reached_5

и должно выйти что-то такое:

site_id   capmaign   lvl_3_counts    lvl_5_counts
A              X                  2                           1
A              Y                  1                           0
B              Y                  0                           2
df.groupby + df.count_values
источник

GZ

German Zvonchuk in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vladimir Komissarov
Де-юре, да.
Де-факто, единицы аномалий можно ручками перепроверить?
Просто мне показалось, что у человека задача не академическая, а прикладная, а ему тут же напихали полный рот регрессоров, фичей и моделей.

Плюс, можно дополнительную метрику ввести с перепроверкой по площади.
я вот выдернул статистику по цене за квадратный метр.

вот теперь только не знаю что из этого мне брать и как использовать?

может взять percentile 50 и сравнивать его с новыми ценами и если разница будет больше двух раз, то буду считать цену некорректной.

https://t.me/bigdata_ru/63504
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
German Zvonchuk
я вот выдернул статистику по цене за квадратный метр.

вот теперь только не знаю что из этого мне брать и как использовать?

может взять percentile 50 и сравнивать его с новыми ценами и если разница будет больше двух раз, то буду считать цену некорректной.

https://t.me/bigdata_ru/63504
Откуда взялось два?)
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Возьми 3 сигмы
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Остановись, ты совершишь ошибку! Ну, если распределение не нормальное.
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
German Zvonchuk
я вот выдернул статистику по цене за квадратный метр.

вот теперь только не знаю что из этого мне брать и как использовать?

может взять percentile 50 и сравнивать его с новыми ценами и если разница будет больше двух раз, то буду считать цену некорректной.

https://t.me/bigdata_ru/63504
Даже ещё проще
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Возьми 1 и 99 процентили
источник

GZ

German Zvonchuk in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Evgenii Zheltonozhskii🇮🇱
Возьми 1 и 99 процентили
и сравнивать новые цены с 1 и 99 перцентилем?
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
German Zvonchuk
и сравнивать новые цены с 1 и 99 перцентилем?
Ну да
источник