Size: a a a

Python для анализа данных

2021 February 21

I

Igor in Python для анализа данных
Но в алгоритмах машинного обучения он тоже используется для того чтобы оценить качество работы алгоритма, обучая его подвыборках с замещением
источник

I

Igor in Python для анализа данных
Но, в отличии от кросс-валидации, гиперпараметры по нему не подбираются
источник

VR

Vasily Rozhkov in Python для анализа данных
ну я о том же. похоже издалека, но точно не одно и то же.
источник

AK

Alex K in Python для анализа данных
@ibeliuha , Vasily Спасибо большое за объяснение
источник
2021 February 22

VO

Valentin Osadchii in Python для анализа данных
Quant
Где можно посмотреть датасеты с публикациями по ним? Мне нужен датасет для диплома и нужно обосновать, почему я выбрал именно это, где он использовался и статистику по нему, не могу никак найти
Датасет ищу, обучив на котором смогу в реальных условиях потом использовать модель, или хотя бы, чтобы работало с моей камерой и распознавало
Я собираюсь ещё приложение написать, которое будет в реальном времени с моделью работать, конкретно в моём случае у меня распознавание жестов и я собираюсь модель прикрутить к камере, пока не определился распознавание языка жестов или что-то типо построения скелета руки в реальном времени по изображению (как в mediapipe hands например), потому что датасетов пока толком не видел
Научрук сказал выбирать датасет, по которому есть публикации нормальные
У гугла был поисковик по датасетам, посмотрите там
источник

ND

Natalya Davydova in Python для анализа данных
привет)
Подскажите, пожалуйста,  для каждой строки датасета имею запрос, вытаскивающий из другой системы 3 значения. Сделала функцию foo, получающую эти 3 значения для каждой строки, чтобы потом вызвать apply() (т.е. ф-ия возвращает 3 значения, если надо - можно завернуть в list или tuple, только непонятно, можно ли будет распаковать)
Можно ли как-то сразу разложить результат работы функции сразу по трем столбцам, а не складывая результат в один?
источник

I

Igor in Python для анализа данных
Natalya Davydova
привет)
Подскажите, пожалуйста,  для каждой строки датасета имею запрос, вытаскивающий из другой системы 3 значения. Сделала функцию foo, получающую эти 3 значения для каждой строки, чтобы потом вызвать apply() (т.е. ф-ия возвращает 3 значения, если надо - можно завернуть в list или tuple, только непонятно, можно ли будет распаковать)
Можно ли как-то сразу разложить результат работы функции сразу по трем столбцам, а не складывая результат в один?
result_type=expand
источник

ND

Natalya Davydova in Python для анализа данных
Получилось, вроде.  Как сделала:
def foo(row):
    ....
    return pd.Series([p1, p2, p3])

df[['col1','col2','col3']] = df.apply(foo, axis=1)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Хотите загадку?

Давным-давно узнал от телефонистов о такой штуке:
соотношение секунд к округленным в большую сторону до целой минуты секундам  = 1.30 независимо от специфики бизнеса и фирмы.
Вот просто в такой аксиоматической формулировке. Бери и пользуйся. Переводи поминутные  тарифы к посекундным умножая на 1.30. Они все так делают.

Со временем я перестал удивляться универсальности коэффициента, ведь это просто части одного и того же случайного процесса. Звонки случайной длительности неважно о чем заканчиваются в любую из секунд минуты.

Но как аналитически рассчитать это соотношение 1.30 (не 1.33333, а 1.30)?
Какая должна быть формула?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
То есть, с практической точки зрения меня интересует уточнение этого коэффициента. Может быть он не 1.30, а цифр там побольше
источник

PZ

Pavel Zheltouhov in Python для анализа данных
история вечная, так что можно расширить на мегабайты, ящики и прочие тарифицируемые, но не полностью расходуемые единицы
источник

M

Maria in Python для анализа данных
Привет!
Есть два csv файла с двумя столбцами в каждом: дата + стоимость
Нужно из второго файла столбец со стоимостью перекинуть в 1 файл с учетом даты.
Проблема в том, что в первом файле пропущенные какие-то дни и во втором пропущены тоже какие-то дни, но другие.
Я делала с помощью concat, но получается неверно.
Как можно добавить столбец из второго файла так, чтобы даты были одинаковые?
источник

AM

Anton Malyshev in Python для анализа данных
Maria
Привет!
Есть два csv файла с двумя столбцами в каждом: дата + стоимость
Нужно из второго файла столбец со стоимостью перекинуть в 1 файл с учетом даты.
Проблема в том, что в первом файле пропущенные какие-то дни и во втором пропущены тоже какие-то дни, но другие.
Я делала с помощью concat, но получается неверно.
Как можно добавить столбец из второго файла так, чтобы даты были одинаковые?
df.merge(df2, on = ['date'], how = 'outer')
источник

k

k in Python для анализа данных
Pavel Zheltouhov
история вечная, так что можно расширить на мегабайты, ящики и прочие тарифицируемые, но не полностью расходуемые единицы
Закон Бенфорда
источник

AM

Anton Malyshev in Python для анализа данных
outer - даст все даты из двух файлов
источник

AM

Anton Malyshev in Python для анализа данных
источник

AZ

Arsenii Zed in Python для анализа данных
Если даты по-разному отформатированы еще, то надо будет datetime юзать
источник

M

Maria in Python для анализа данных
Arsenii Zed
Если даты по-разному отформатированы еще, то надо будет datetime юзать
Одинаково
источник

M

Maria in Python для анализа данных
Спасибо огромное!
источник

AD

Alexander Dergilev in Python для анализа данных
Maria
Привет!
Есть два csv файла с двумя столбцами в каждом: дата + стоимость
Нужно из второго файла столбец со стоимостью перекинуть в 1 файл с учетом даты.
Проблема в том, что в первом файле пропущенные какие-то дни и во втором пропущены тоже какие-то дни, но другие.
Я делала с помощью concat, но получается неверно.
Как можно добавить столбец из второго файла так, чтобы даты были одинаковые?
.strftime('%Y-%m-%d') как вариант, если это просто дата, а не дата-время
источник