Size: a a a

Python для анализа данных

2021 March 17

VR

Vasily Rozhkov in Python для анализа данных
логарифм в помощь)
источник

YS

Yevhenii Sh. in Python для анализа данных
Скажите, например в екомерсе использования логорифма для суммы заказа это норм? Думаю как потом обьяснять почему цифры такие...
источник

КД

Кирилл Дмитриевич... in Python для анализа данных
Vasily Rozhkov
логарифм в помощь)
А обратно как? Exp от среднего по логарифму?
источник

КД

Кирилл Дмитриевич... in Python для анализа данных
Получается неадекватное число
источник

VR

Vasily Rozhkov in Python для анализа данных
Кирилл Дмитриевич
Получается неадекватное число
проверьте не берется ли логарифм от нуля гдето
если с логарифмами неудобно попробуйте что то типа гамма распределения подставить. можно критерием согласия к примеру попробовать проверить
источник

VR

Vasily Rozhkov in Python для анализа данных
Yevhenii Sh.
Скажите, например в екомерсе использования логорифма для суммы заказа это норм? Думаю как потом обьяснять почему цифры такие...
так не нужно забывать делать обратные преобразования
источник

VR

Vasily Rozhkov in Python для анализа данных
только аккуратно надо
источник

YS

Yevhenii Sh. in Python для анализа данных
Vasily Rozhkov
только аккуратно надо
Спасибо за ответ, может поможет.
источник

I

Igor in Python для анализа данных
Vasily Rozhkov
логарифм в помощь)
Если логарифмировать, то для оценки интервалов нужно использовать поправку Йетса, поскольку получится нормальное (что нужно ещё проверить) распределение, которое не дискретное.
источник

D

Darya in Python для анализа данных
Привет! Есть датасет с полями: юзер айди, количество его покупок (в штуках), сумма покупок. Необходимо разделить его на 2 части так, чтобы среднее (или медианное) значение количества покупок и суммы покупок было равное в обеих группах. Подскажите, плиз, как это можно реализовать?
источник

AK

Aleksei Komissarov in Python для анализа данных
Darya
Привет! Есть датасет с полями: юзер айди, количество его покупок (в штуках), сумма покупок. Необходимо разделить его на 2 части так, чтобы среднее (или медианное) значение количества покупок и суммы покупок было равное в обеих группах. Подскажите, плиз, как это можно реализовать?
А есть такой вариант, что это сделать невозможно?
источник

D

Darya in Python для анализа данных
Aleksei Komissarov
А есть такой вариант, что это сделать невозможно?
Нет
источник

AK

Aleksei Komissarov in Python для анализа данных
Ну как же.

id count sum
1       1      1000
2       5       100000000
3       2       2
источник

AK

Aleksei Komissarov in Python для анализа данных
И как делить?
источник

AK

Aleksei Komissarov in Python для анализа данных
Сразу по двум условиям: "чтобы среднее (или медианное) значение количества покупок и суммы покупок было равное в обеих группах"
источник

D

Darya in Python для анализа данных
Это не тот вариант. В датасете +- 4000-5000 юзеров
источник

AK

Aleksei Komissarov in Python для анализа данных
Среднее - это сумма всего / количество всего. Если нам нужно сделать так, чтобы и сумма покупок, и среднее были равны в обеих группах, то и количество этих покупок тоже должно быть одинаковым.
источник

AK

Aleksei Komissarov in Python для анализа данных
а я так ждал, что это будет оспорено
источник

T

Tishka17 in Python для анализа данных
Сорян, подумать помогает
источник

КД

Кирилл Дмитриевич... in Python для анализа данных
Vasily Rozhkov
проверьте не берется ли логарифм от нуля гдето
если с логарифмами неудобно попробуйте что то типа гамма распределения подставить. можно критерием согласия к примеру попробовать проверить
А как построить доверительные интервалы для гамма-распределения? Гуглю, но ничего не понимаю
источник