Size: a a a

Python для анализа данных

2021 August 31

S

Somebody in Python для анализа данных
Как-то мне пришлось послушать, как преподают геометрию в обычной школе - это был фейспалм
"Берем таблицу Брадиса..."
Вот вам и пробелы, учителя просто не знают этой геометрии
Статистика ЕГЭ тому доказательство
источник

S

Somebody in Python для анализа данных
Это смотря как в нее уходить
Чтоб ту самую модель сделать, вообще говоря, нужно математика довольно сурового найти
источник

h

helby in Python для анализа данных
Для себя решил, что просто туда не ногой больше))
источник

VM

Valerii Mamontov in Python для анализа данных
👍
источник

PZ

Pavel Zheltouhov in Python для анализа данных
а что бы дала математика? условную теореому невозможности загрузить все данные всего мира в xgboost ?
источник

S

Somebody in Python для анализа данных
Оценить параметры распределений байесовскими методами, оценить наиболее вероятные цены конкурентов
В этой задаче размерность данных слишком большая, и их объем маленький
источник

S

Somebody in Python для анализа данных
Если предсказывать сначала кол-во клиентов, потом сколько они принесут, ЗБЧ может не сработать при "малых" порядках клиентов
источник

H

Hatikva in Python для анализа данных
#вакансия #Smartcat #BIanalyst #analyst

Компания: Smartcat https://ru.smartcat.com/about-us/
Вакансия: BI Analyst
Локация офиса: г. Москва, м. Отрадное
Формат работы: Удалёнка, нанимаем по всему миру
Занятость: полная
Финансовая мотивация: 120 - 180k net
Условия: Оформление по ТК РФ, по контракту или по ИП, ДМС,  корпоративные мероприятия.

💜 Smartcat - универсальная система для непрерывной работы над переводческими задачами. Она позволяет интегрировать все этапы работы над переводами и объединить исполнителей и заказчиков языковых услуг в рамках единой онлайн-платформы. Smartcat - это, по сути, market network, то есть система, в которой у пользователей есть инструменты как для работы, так и для общения с другими участниками.
Высокий потенциал роста Smartcat подтверждён инвестициями от крупных фондов. Нас поддерживают Baring Vostok и Matrix Partners, которые входят в топ главных венчурных фондов мира.

👫🏻🐈‍Кто нужен:
Мы ищем BI аналитика для усиления продуктовой команды, чтобы на данных детально прорабатывать возникающие гипотезы и задачи.

🦾 Основные задачи:
- Анализ существующих данных и определение недостающих, с постановкой задач на их извлечение
- Предложение продуктовых гипотез и нахождение потенциальных точек роста - в связке с продакт менеджером и самостоятельно
- Построение воронок, user journey maps
-Построение дашбордов/отчетов для разработки для оценки эффективности выпущенных фич

🤺 Требуемые навыки:
- Умение логично и системно мыслить и закапываться в детали
- Хороший уровень владения SQL (несколько вложенных джоинов, оконные функции)
- Опыт работы с Grafana или другими BI-системами (Tableau, Power BI, любые другие)
Плюсом будет опыт работы с MongoDB, ElasticSearch и системами продуктовой аналитики (Mixpanel, pendo.io, и прочие)
- Английский язык на уровне upper-intermediate

🛠 Наши технологии:
- Data warehouse на базе PostgreSQL
- ETL на C#
- Grafana в качестве UI
- Mixpanel для продуктовой аналитики
- Бэклог команды в Notion
- Корпоративный мессенджер - Slack
- Git для хранения исходников

⚡️Главное - выполнить поставленную задачу в срок и хорошо, по графику и месту работы договоримся!⚡️

🦊 Вопросы по вакансии и резюме можно направлять мне @YourFireFox
источник

H

Hatikva in Python для анализа данных
#вакансия #Smartcat #DataEngineer

Компания: Smartcat https://ru.smartcat.com/about-us/
Вакансия: Data Engineer
Локация офиса: г. Москва, м. Отрадное
Формат работы: Удалёнка, нанимаем по всему миру
Занятость: полная
Финансовая мотивация: 70-120 net для джуна, 120-200 net для миддла
Условия: Оформление по ТК РФ, по контракту или по ИП, ДМС,  корпоративные мероприятия.

💜 Smartcat - универсальная система для непрерывной работы над переводческими задачами. Она позволяет интегрировать все этапы работы над переводами и объединить исполнителей и заказчиков языковых услуг в рамках единой онлайн-платформы. Smartcat - это, по сути, market network, то есть система, в которой у пользователей есть инструменты как для работы, так и для общения с другими участниками.
Высокий потенциал роста Smartcat подтверждён инвестициями от крупных фондов. Нас поддерживают Baring Vostok и Matrix Partners, которые входят в топ главных венчурных фондов мира.


🦾 Основные задачи:

- Развернуть современный стек аналитических технологий;
- Перестроить систему хранения данных, разделив на горячее и холодное хранилище;
- Выстроить пайплайн обработки данных и систему контроля их качества;
- Обеспечить качественными релевантными данными каждое бизнес-направление;
- Активно учиться и делиться знаниями с командой.

🤺 Мы ожидаем, что ты:

- Пишешь чистые, понятные и эффективные SQL-запросы, которые легко читать и модифицировать;
- Без проблем пишешь код для работы с API или трансформации данных;
- Обладаешь опытом работы с Airflow и настройки ETL-процессов;
- Умеешь работать с Linux-системами, не боишься зайти на сервер для его настройки;
- Не представляешь жизни без Git'а или другой системы контроля версий;
- Документируешь каждый свой шаг и каждый процесс, который настраиваешь;
- Знаешь английский язык как минимум на уровне чтения гайдов;
- Можешь работать в динамичной среде стартапа и привносить в команду и продукт что-то новое, а не просто следовать инструкциям.

➕ Плюсом будет:

- Умение читать код на C#;
- Опыт работы с MongoDB;
- Опыт оптимизации SQL-запросов и тюнинга производительности СУБД;
- Опыт проектирования баз данных и DWH, знание разных подходов к хранению данных;
- Опыт работы с разными типами хранилищ, способность объяснить, когда лучше использовать файловое хранилище, а когда - колоночную базу;
- Понимание продуктовых метрик;
- Опыт создания прогнозных/финансовых моделей;
- Опыт работы с Hadoop-стеком (Hive, Spark, Flink, Kafka etc.);
- Опыт работы с AWS;
- Опыт работы с Docker и k8s;
- Хороший устный и письменный английский;
- Умение объяснить, что драйвит тебя в работе.

🎁 Что мы предлагаем:

- Официальное оформление по ТК РФ;
- Максимально гибкий график;
- Работу удалённо или из офиса в Москве (офис в 7 минутах пешком от метро, бесплатный спортзал здесь же);
- Множество направлений для роста: мы стартап и ориентируемся на человека и его мотивацию, а не на жёсткую структуру корпоративной иерархии;
- Свободу в принятии решений, выборе технологий, экспериментах;
- Мы не ограничиваем твои амбиции, а, наоборот, поощряем их: твой профессиональный и финансовый рост будет зависеть только от твоих желаний и возможностей.


🦊 Вопросы по вакансии и резюме можно направлять мне @YourFireFox
источник

H

Hatikva in Python для анализа данных
Сорри за спам))
источник

ТХ

Тимур Хасанов... in Python для анализа данных
ну поперли объявления
источник

ТХ

Тимур Хасанов... in Python для анализа данных
Главное, чтобы здесь не заполонили такие сообщения
источник

А

Алексей in Python для анализа данных
коллеги, вставляю данные из датафрейма в БД, использую для этого pandas, df.to_sql . Получаю ошибку, что столбцов у некоторых строк больше, чем в таблице БД. Насколько я понял, pandas под капотом датафрейм трансформирует в текстовый файл с разделителями полей запятые и если в поле есть запятая, то он делит его на 2 столбца.
Внимание, вопрос: как экранировать запятые :)?
источник

AD

Alexander Dergilev in Python для анализа данных
А ошибку пришлите
источник

А

Алексей in Python для анализа данных
(vertica_python.errors.CopyRejected) Severity: b'ERROR', Message: b'COPY: Input record 5 has been rejected (Too many columns found)'
источник

I

Igor in Python для анализа данных
Да не разбирает pandas колонки по запятой
источник

I

Igor in Python для анализа данных
Возможно есть кавычки?
источник

AD

Andrew Dakhnovsky in Python для анализа данных
а есть возможность глянуть на какой строчке он ошибся?
сравнить с другими строками
источник

А

Алексей in Python для анализа данных
FROM STDIN DELIMITER \',\' ENCLOSED BY \'"\' ENFORCELENGTH ABORT ON ERROR'
источник

А

Алексей in Python для анализа данных
мне всё-таки кажется, что дело именно в запятых и кавычках
источник