Size: a a a

Python для анализа данных

2021 July 20

M

Mikhail in Python для анализа данных
не, невариант, он мне итак через пандас заливать итоговый df не дает( долго висит (200к строк может часов 8 лить)
источник

A

Andrey Denisov in Python для анализа данных
Кто не даёт? Почему? Куда?
С постгрес там не всё просто, насколько я слышал, но 200К строк залить в таблицу - несколько минут.
Но при чём тут "долгое заливание" и "ежедневно выполняемая процедура"? Последнее - крон, а почему долго что-то отрабатывает - надо смотреть и дебажить
источник

R

Rustam in Python для анализа данных
Добрый день!
Может тривиальный вопрос, но ответа не нашел ...
Как можно разделить (separator) числа через пробелы от миллиарда до сотых ?
источник

A

Andrey Denisov in Python для анализа данных
источник

VM

Valerii Mamontov in Python для анализа данных
Добрый день!
Python может так:

a = 1000000
b = 1_000_000
источник

R

Rustam in Python для анализа данных
replace )) почему то раньше не дошло, спасибо большое!
источник

AK

Anup Kuplu in Python для анализа данных
кто пробовал этот бесплатный курс ? стоит изучать ?
источник

AK

Anup Kuplu in Python для анализа данных
источник
2021 July 21

АТ

Алексей Терехин... in Python для анализа данных
Привет!
Посоветуйте, плиз, что почитать по статистике (аб тесты), желательно, с примерами на питоне
источник

АМ

Алексей Макаров... in Python для анализа данных
Telegram
Datalytics
📊Статистика, прогнозирование, эксперименты и AB-тестирования🔬

**Эксперименты**

Расчёт каннибализации на основе классического A/B-теста и метод bootstrap’а
Множественные эксперименты: теория и практика
🔥 Подборка от Vit Cheremisinov и Iskandar Mirmakhmadov
Простой гид по байесовскому А/B-тестированию на Python
Краткое руководство по реализации A/B тестов на Python
Математика A/B-тестирования с примером кода на Python
Байесовский подход к оценке результатов A/B-тестирования
A/B-тесты на несбалансированных выборках
Про архитектуру экспериментов в Flo Health [data engineering]

**Методики**

Разбор и несколько примеров расчёта effect size (величины эффекта)
Метод оценки максимального правдоподобия (MLE)
Кластеризация последовательности значений с помощью метода оптимизации Дженкса
Predictive Power Score для линейной и нелинейной зависимости

**Туториалы**

🔥 Тестирование статистических гипотез с помощью Python
🔥 Сборник готовых рецептов для практического применения статистических методов
Пример использования…
источник
2021 July 22

AK

Anup Kuplu in Python для анализа данных
источник
2021 July 23

ee

elnur elnur in Python для анализа данных
Проверяете ли переменные на нормальность или сразу карреляцию делаете?
Верны ли мои скрипты, которые использовал для определения нормальности столбца?
источник

K

Kseniia in Python для анализа данных
А зачем проверять переменные на нормальность? Для поиска корреляции это не нужно.
источник

ee

elnur elnur in Python для анализа данных
странно... я на канале (https://www.youtube.com/watch?v=cQlIqRltV3A&list=PL8NhLxUy1ckylqkbDvEIuBhpIGsO0yIdS) обратное слышал. до корреляции нужно данные проверить но нормальность, а после проводить нужную корреляцию🤔
простите, вы практикующий аналитик?
YouTube
АНАЛИЗ ДАННЫХ введение | АНАЛИЗ ДАННЫХ #1
Введение в анализ данных. Анализ данных #1. Когда и зачем применять методы анализа данных? Какова цель анализа данных?

Название дисциплины: информационная диагностика социальных объектов и процессов (ИДСОиП).
Основная цель дисциплины – изучить и отработать на практике методы анализа данных. Самая главная задача – разобраться в предложенной аналитической стратегии, второстепенная задача – научиться реализовывать стратегию анализа данных, используя программных помощников: статистические пакеты анализа данных, средства электронных таблиц.
Курс предназначен не для математиков, а для тех, кто скорее побаивается чистой математики, но нуждается в ее статистическом аппарате. Собственно, математических выкладок в курсе не будет, математика статистических методов рассматривается поверхностно и лишь для общего представления об используемых инструментах.
Что будет? Знакомство с минимальным необходимым ассортиментом методов анализа данных. Овладение стратегией выбора нужного метода для решения конкретной аналитической задачи.…
источник

K

Kseniia in Python для анализа данных
Я ещë и статистик. Где там сказано, что для расчета корреляции нужно проверять данные на нормальность?
источник

ee

elnur elnur in Python для анализа данных
отлично. я вам скину.
источник

ee

elnur elnur in Python для анализа данных
пожалуйста просмотрите видео ~ 13 мин:
https://www.youtube.com/watch?v=2e6EStpZwIU
источник

A

Alexandr in Python для анализа данных
Во-первых, насколько я помню, нормальность - одно из самых слабых требований GLM моделей. Поэтому, даже если вы его не пройдёте, ничего страшного не произойдёт) если вас интересует доверительный интервал и иже с ними  вашей корреляции - то вы можете посчитать bootstrap корреляцию или перейти на Байесовы методы
Во-вторых, есть непараметрические коэффициенты корреляции - можете использовать их, правда, они, более underpowered.
источник

A

Alexandr in Python для анализа данных
Почти всегда данные будут ненормальны)) и почти всегда это не составит проблем

Поправьте, если где ошибся
источник

I

Ivan Burmachev in Python для анализа данных
"Проверка на нормальность" == "подчиняются ли данные нормальному распределению"? Или я неправильно понимаю?
источник