Телеграмм чат группы pydata_chat страница 658

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Python для анализа данных

2078 membersпожаловаться на группу

2021 February 21

I

Igor in Python для анализа данных

Но в алгоритмах машинного обучения он тоже используется для того чтобы оценить качество работы алгоритма, обучая его подвыборках с замещением

источник

14:03пожаловаться #1

I

Igor in Python для анализа данных

Но, в отличии от кросс-валидации, гиперпараметры по нему не подбираются

источник

14:04пожаловаться #2

VR

Vasily Rozhkov in Python для анализа данных

ну я о том же. похоже издалека, но точно не одно и то же.

источник

14:12пожаловаться #3

AK

Alex K in Python для анализа данных

@ibeliuha , Vasily Спасибо большое за объяснение

источник

22:48пожаловаться #4

2021 February 22

VO

Valentin Osadchii in Python для анализа данных

Quant

Где можно посмотреть датасеты с публикациями по ним? Мне нужен датасет для диплома и нужно обосновать, почему я выбрал именно это, где он использовался и статистику по нему, не могу никак найти
Датасет ищу, обучив на котором смогу в реальных условиях потом использовать модель, или хотя бы, чтобы работало с моей камерой и распознавало
Я собираюсь ещё приложение написать, которое будет в реальном времени с моделью работать, конкретно в моём случае у меня распознавание жестов и я собираюсь модель прикрутить к камере, пока не определился распознавание языка жестов или что-то типо построения скелета руки в реальном времени по изображению (как в mediapipe hands например), потому что датасетов пока толком не видел
Научрук сказал выбирать датасет, по которому есть публикации нормальные

У гугла был поисковик по датасетам, посмотрите там

источник

10:51пожаловаться #5

ND

Natalya Davydova in Python для анализа данных

привет)
Подскажите, пожалуйста, для каждой строки датасета имею запрос, вытаскивающий из другой системы 3 значения. Сделала функцию foo, получающую эти 3 значения для каждой строки, чтобы потом вызвать apply() (т.е. ф-ия возвращает 3 значения, если надо - можно завернуть в list или tuple, только непонятно, можно ли будет распаковать)
Можно ли как-то сразу разложить результат работы функции сразу по трем столбцам, а не складывая результат в один?

источник

11:20пожаловаться #6

I

Igor in Python для анализа данных

Natalya Davydova

привет)
Подскажите, пожалуйста, для каждой строки датасета имею запрос, вытаскивающий из другой системы 3 значения. Сделала функцию foo, получающую эти 3 значения для каждой строки, чтобы потом вызвать apply() (т.е. ф-ия возвращает 3 значения, если надо - можно завернуть в list или tuple, только непонятно, можно ли будет распаковать)
Можно ли как-то сразу разложить результат работы функции сразу по трем столбцам, а не складывая результат в один?

result_type=expand

источник

11:31пожаловаться #7

ND

Natalya Davydova in Python для анализа данных

Получилось, вроде. Как сделала:

def foo(row):
     ....
     return pd.Series([p1, p2, p3])

df[['col1','col2','col3']] = df.apply(foo, axis=1)

источник

11:36пожаловаться #8

PZ

Pavel Zheltouhov in Python для анализа данных

Хотите загадку?

Давным-давно узнал от телефонистов о такой штуке:
соотношение секунд к округленным в большую сторону до целой минуты секундам = 1.30 независимо от специфики бизнеса и фирмы.
Вот просто в такой аксиоматической формулировке. Бери и пользуйся. Переводи поминутные тарифы к посекундным умножая на 1.30. Они все так делают.

Со временем я перестал удивляться универсальности коэффициента, ведь это просто части одного и того же случайного процесса. Звонки случайной длительности неважно о чем заканчиваются в любую из секунд минуты.

Но как аналитически рассчитать это соотношение 1.30 (не 1.33333, а 1.30)?
Какая должна быть формула?

источник

18:38пожаловаться #9

PZ

Pavel Zheltouhov in Python для анализа данных

То есть, с практической точки зрения меня интересует уточнение этого коэффициента. Может быть он не 1.30, а цифр там побольше

источник

18:38пожаловаться #10

PZ

Pavel Zheltouhov in Python для анализа данных

история вечная, так что можно расширить на мегабайты, ящики и прочие тарифицируемые, но не полностью расходуемые единицы

источник

18:41пожаловаться #11

M

Maria in Python для анализа данных

Привет!
Есть два csv файла с двумя столбцами в каждом: дата + стоимость
Нужно из второго файла столбец со стоимостью перекинуть в 1 файл с учетом даты.
Проблема в том, что в первом файле пропущенные какие-то дни и во втором пропущены тоже какие-то дни, но другие.
Я делала с помощью concat, но получается неверно.
Как можно добавить столбец из второго файла так, чтобы даты были одинаковые?

источник

20:57пожаловаться #12

AM

Anton Malyshev in Python для анализа данных

Привет!
Есть два csv файла с двумя столбцами в каждом: дата + стоимость
Нужно из второго файла столбец со стоимостью перекинуть в 1 файл с учетом даты.
Проблема в том, что в первом файле пропущенные какие-то дни и во втором пропущены тоже какие-то дни, но другие.
Я делала с помощью concat, но получается неверно.
Как можно добавить столбец из второго файла так, чтобы даты были одинаковые?

df.merge(df2, on = ['date'], how = 'outer')

источник

20:59пожаловаться #13

k

k in Python для анализа данных

Pavel Zheltouhov

история вечная, так что можно расширить на мегабайты, ящики и прочие тарифицируемые, но не полностью расходуемые единицы

Закон Бенфорда

источник

20:59пожаловаться #14

AM

Anton Malyshev in Python для анализа данных

outer - даст все даты из двух файлов

источник

20:59пожаловаться #15

AM

Anton Malyshev in Python для анализа данных

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html

источник

20:59пожаловаться #16

AZ

Arsenii Zed in Python для анализа данных

Если даты по-разному отформатированы еще, то надо будет datetime юзать

источник

21:03пожаловаться #17

M

Maria in Python для анализа данных

Если даты по-разному отформатированы еще, то надо будет datetime юзать

Одинаково

источник

21:04пожаловаться #18

M

Maria in Python для анализа данных

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html

Спасибо огромное!

источник

21:04пожаловаться #19

AD

Alexander Dergilev in Python для анализа данных

Привет!
Есть два csv файла с двумя столбцами в каждом: дата + стоимость
Нужно из второго файла столбец со стоимостью перекинуть в 1 файл с учетом даты.
Проблема в том, что в первом файле пропущенные какие-то дни и во втором пропущены тоже какие-то дни, но другие.
Я делала с помощью concat, но получается неверно.
Как можно добавить столбец из второго файла так, чтобы даты были одинаковые?

.strftime('%Y-%m-%d') как вариант, если это просто дата, а не дата-время

источник

21:52пожаловаться #20