Size: a a a

Python для анализа данных

2020 December 08

KM

Konstantin Mohov in Python для анализа данных
Если будет множество косвенных факторов, влияющих на закупку, модель это увидит. лишь бы этих данных было, действительно, много
источник

R

Ruslan in Python для анализа данных
Prophet
источник

R

Ruslan in Python для анализа данных
Регрессию
источник

KM

Konstantin Mohov in Python для анализа данных
начать можно и с обычной регрессии, ага
источник

KM

Konstantin Mohov in Python для анализа данных
а потом посмотреть, как покажет себя CNN
источник

SF

Sergey Filkin in Python для анализа данных
Andrey Denisov
Собственно, вопрос был - с чего начать? Есть какая-то либа или направление куда копать?
Слышал что-то про fb-шную либу
источник

R

Ruslan in Python для анализа данных
Важно добавить нормативы на складах. То есть часто бывает когда товародвижение размещает заказы но к концу месяца или квартала необходимо срезать заказы так как товарный запас не укладывается в лимиты. Это нужно отразить в виде предиктора регрессии.
источник

A

Andrey Denisov in Python для анализа данных
Ruslan
Важно добавить нормативы на складах. То есть часто бывает когда товародвижение размещает заказы но к концу месяца или квартала необходимо срезать заказы так как товарный запас не укладывается в лимиты. Это нужно отразить в виде предиктора регрессии.
Ну мне бы в первом приближении оценить будет вообще тут применимо или нет. Влияющих факторов - много, но не все можно оцифровать

За наводку - спасибо
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Andrey Denisov
Ну мне бы в первом приближении оценить будет вообще тут применимо или нет. Влияющих факторов - много, но не все можно оцифровать

За наводку - спасибо
да в первом применении загрузите вон в  Табло
источник

A

Andrey Denisov in Python для анализа данных
Почему именно туда?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
ну там есть сезонность и вообще все максимально примитивно
источник

PZ

Pavel Zheltouhov in Python для анализа данных
а потом попробуйте хотя бы за несколько дней на питоне написать аналог. чтобы получить на prophet тот же результат
источник

A

Andrey Denisov in Python для анализа данных
Не знал, что Табло может не просто визуализировать, спасибо
источник

R

Ruslan in Python для анализа данных
Konstantin Mohov
мы тоже думаем, что наше поведение в интернете -управляемая величина, однако, гугл все знает наперед))
Если вы про рекомендательные системы то это вообще разные вещи.
источник

VG

Vitaliy Gasnikov in Python для анализа данных
Переслано от Vitaliy Gasnikov
#вакансия #работа #удаленно #python #sql #bash #spark #docker #eda #lightgbm
Вакансия: Старший аналитик-разработчик Python;
Город: Москва;
Зарплата: 195 000 - 207 000 ₽;
Опыт: от 3 лет;
Формат работы: офис/удаленно (по желанию);
График работы: 5/2;
Компания: www.mediascope.net

Друзья, компания Mediascope в сектор моделирования данных, ищет старшего аналитика-разработчика Python.

Наш сектор занимается поддержкой работы конвейеров поставки данных, когда недостаточно простого ETL. Сбор информации о предпочтениях пользователей
производится самыми разнообразными средствами, поэтому необходимо объединять различные источники данных. Отсюда большой спектр задач, поэтому
используем самые разные алгоритмы от линейных моделей до случайного леса и бустинга, нейросетей (для табличных данных, CV, NLP), рекомендательных систем
и кластеризации.
Если вы присоединитесь к нашей команде, вас ожидают множество интересных и сложных задач, большие массивы данных разной природы, возможность
экспериментов и дружный коллектив.

Требования:

Опыт коммерческой разработки на Python, хорошая алгоритмическая подготовка;
Уверенное знание Python;
Опыт работы с основными библиотеками машинного обучения (scipy-стэк, scikit-learn, xgboost, lightgbm, pytorch);
Опыт внедрения моделей машинного обучения в промышленную эксплуатацию;
Знание основ математической статистики, алгоритмов и структур данных;
Знание основных алгоритмов машинного обучения;
Умение читать научные статьи;
Знание SQL;
Bash, git.

Будет плюсом:

Навыки работы со spark;
Опыт оптимизации расчётов;
Опыт работы с docker.

Обязанности:

EDA (exploratory data analysis) — объединять массивы данных из различных источников, исследовать их структуру и искать закономерности, формировать и
проверять гипотезы на основе данных;
Строить пайплайны обработки данных и обучения моделей;
Сопровождать и развивать существующий комплекс обработки данных;
Поиск, обнаружение аномалий в данных и настройка оповещений о критических изменениях.
Нужно быть готовым к участию в проекте на всех этапах от формирования гипотезы до сборки ML-конвейера в production:
Построение прототипа;
Продуктивизация, покрытие тестами;
Разворачивание в виде сервиса с мониторингом метрик качества.

Условия:

Возможность работать из дома в условиях самоизоляции и гибкий подход к рабочему графику;
При необходимости - современный и комфортный офис класса А в пешей доступности от м. Савеловская и м. Марьина Роща;
Конкурентную заработную плату от 195 000 ₽ до 207 000 ₽;
Официальное оформление: все процессы согласно ТК;
Заботу о вашем здоровье – хорошую страховку ДМС, включающую обслуживание в ведущих центрах Москвы;
Соблюдение необходимых мер по обеспечению безопасности здоровья в офисном пространстве;
Дружелюбную корпоративную культуру, приятных коллег и отсутствие дресс-кода;
Корпоративные скидки у различных партнеров компании.

Контакты:

По всем вопросам пишите в Telegram @leonety_lety@leonety_lety или на емаил vitaly@income-personal.onlinevitaly@income-personal.online
источник
2020 December 09

KP

Konstantin Petrov in Python для анализа данных
что то можно сделать в Spyder, что когда код отработал, то не передает управление и не загружает переменные в панель?
источник

KP

Konstantin Petrov in Python для анализа данных
источник

TZ

Tsokto Zhigmytov in Python для анализа данных
Требуется совет и идеи по задаче.

Это оценка стат. энтропии (как я понял). Подозреваю, есть какой-то стандартный пакет или функция в scipy/numpy, где энтропию можно задать.

Основная закавыка, я так понимаю, в объёме записей и вычислений, их надо как-то не в лоб оптимизировать.

Заранее благодарю.
источник

s

ssv in Python для анализа данных
Konstantin Petrov
что то можно сделать в Spyder, что когда код отработал, то не передает управление и не загружает переменные в панель?
Что бы именно не передавал? Или передавал?
источник

KP

Konstantin Petrov in Python для анализа данных
ssv
Что бы именно не передавал? Или передавал?
передавал)
источник