Size: a a a

Python для анализа данных

2021 July 23

A

Alexandr in Python для анализа данных
ага! Или сами данные, или остатки в зависимости от требований стат модели
источник

I

Ivan Burmachev in Python для анализа данных
Я сам нуб, смотрю курс тоже один сейчас, и там как раз рассматриваются всевозможные регрессии. Там и слова нет о таких проверках. Судя по вики, нужны такие проверки для использования различных критериев, обладающих более сильными свойствами, но посчитать MSE какое-нибудь мы ведь и без этого можем
источник

A

Alexandr in Python для анализа данных
+++,  поэтому я и говорю, что если есть дополнительные вопросики, то только тогда имеет смысл запариться, но если модель не проходит эту проверку, то решений тонна
источник

СИ

Сергей Ильин... in Python для анализа данных
добрый день.
чет запутался, нид хелп

есть датасет:


d = {
   'dt': [
       '01.01.2020',
       '01.01.2020',
       '01.01.2020',
       '01.01.2020',
       '02.01.2020',
       '02.01.2020',
       '02.01.2020',
       '02.01.2020',
       '02.01.2020',
       '03.01.2020',
       '03.01.2020',
       '03.01.2020',
       ],
   'name': [
       'Billy',
       'Dilly',
       'Villy',
       'Villy',
       'Billy',
       'Dilly',
       'Villy',
       'Billy',
       'Dilly',
       'Villy',
       'Billy',
       'Dilly']}

test = pd.DataFrame(data=d)

я хотел бы получить колонку 'count'
,
котор
ая содержит количество имен в этот день.

То есть что-то в духе:


d = {
   'dt': [
       '01.01.2020',
       '01.01.2020',
       '01.01.2020',
       '01.01.2020',
       '02.01.2020',
       '02.01.2020',
       '02.01.2020',
       '02.01.2020',
       '02.01.2020',
       '03.01.2020',
       '03.01.2020',
       '03.01.2020',
       ],
   'name': [
       'Billy',
       'Dilly',
       'Villy',
       'Villy',
       'Billy',
       'Dilly',
       'Villy',
       'Billy',
       'Dilly',
       'Villy',
       'Billy',
       'Dilly'],
   'count': [
       4,
       4,
       4,
       4,
       5,
       5,
       5,
       5,
       5,
       3,
       3,
       3],
   
   }

test = pd.DataFrame(data=d)
единственное - без группировки (как с группировкой - понятно, можно по дате, но мне не нужно аггрегировать)

там, наверное, что-то с лямбдами должно быть, но я чет не допер как.

Заранее спасибо за помощь.
источник

3

3ldar in Python для анализа данных
источник

СИ

Сергей Ильин... in Python для анализа данных
огонь. то, что надо. я херово гуглю ((
источник

K

Kseniia in Python для анализа данных
Эльнур, какой-то странный курс.
источник

ee

elnur elnur in Python для анализа данных
😀
источник

K

Kseniia in Python для анализа данных
Коэффициент корреляции Спирмена рассчитывается для количественных показателей. Неважно, как они распределены. Это два набора данных одинаковой длины? Значит между ними можно посчитать связь по формуле.
источник

K

Kseniia in Python для анализа данных
Рекомендую взять обычный учебник, например, под редакцией Громыко, и учиться по нему.
источник

ee

elnur elnur in Python для анализа данных
есть курсы, желательно бесплатные, которые могли бы посоветовать мне?
источник

ee

elnur elnur in Python для анализа данных
✔️
источник

K

Kseniia in Python для анализа данных
Коэффициенты корреляции Спирмена и Кендела рассчитываются на основании ранговых переменных.
источник

K

Kseniia in Python для анализа данных
источник

K

Kseniia in Python для анализа данных
Вот эта табличка выдает, что автор сам не в теме
источник

K

Kseniia in Python для анализа данных
Самое лучшее-прорешать учебник Громыко (она из МГУ). Это очень понятный учебник.
источник

K

Kseniia in Python для анализа данных
Есть ещё курс на Степике
Но вообще, курсы, обычно, это "взлёт-посадка".
источник

K

Kseniia in Python для анализа данных
источник

h

helby in Python для анализа данных
привет ребята.

Есть 5 миллионов строк

в одном столбце дата, в другом время

их нужно обьединить в один , с пробелом в виде « «

Все способы которые находил в нэте, работают ужасно долго

более 10 секунд

Есть какие то , возможно, ускоренные пакеты для работы с датами в столбцах?
источник

AD

Alexander Dergilev in Python для анализа данных
Питон, sql?
источник