Size: a a a

Python для анализа данных

2021 October 04

M

Mikhail in Python для анализа данных
Покажите df.dtypes
источник

В

Виктория in Python для анализа данных
В первую очередь проверяла типы данных, везде float64
источник

M

Mikhail in Python для анализа данных
Если nan нулями заполняли, то сдаюсь
источник

В

Виктория in Python для анализа данных
И нулями и средним, не меняется корреляция между GDP и переменной, куда заполняла... Просто бум в голове, вообще идей нет почему так.
источник

M

Mikhail in Python для анализа данных
Проблема явно не в этом))
источник

M

Mikhail in Python для анализа данных
А это прям пандас-пандас?
источник

В

Виктория in Python для анализа данных
Прям пандас-пандас, в jupyter lab строчу на питоне, другого-то и не умею))
источник

В

Виктория in Python для анализа данных
Странно, что даже GDP-GDP корреляция как единица не находится, что-то видимо с данными именно там. Может когда словарь в датафрейм делала что-то нарушила
источник

SS

Sergey Svetlov in Python для анализа данных
В gdp постоянное значение? Там и не дБ корреляции в таком случае
источник

В

Виктория in Python для анализа данных
Постоянные значения типа float
источник

SS

Sergey Svetlov in Python для анализа данных
Корреляция с константой не определена, поэтому Nan
источник

В

Виктория in Python для анализа данных
Если Вы  можете помочь найти информацию подробнее про то, как сказать питону, что это не константа и прочее - буду рада. Потому что плохо понимаю, как проверить константа ли числа (вручную я ничего не вводила) и исправить ситуацию)
источник

SS

Sergey Svetlov in Python для анализа данных
df["GDP"].std() чему равно?)
источник

В

Виктория in Python для анализа данных
источник

SS

Sergey Svetlov in Python для анализа данных
Ну это "ноль", т.е. там стоит постоянная величина в столбце. По определению нельзя посчитать корреляцию с константой, потому что по формуле получится деление на этот ноль.
источник

В

Виктория in Python для анализа данных
Спасибо, будем дальше думать)
источник
2021 October 05

К

Карась судьбы... in Python для анализа данных
Может кто-нибудь подсказать, пожалуйста, как узнать метки классов для предсказанной модели на основе случайного леса и XGBoost. У меня есть 4 класса (1, 2, 3, 4). Я обучаю модель, затем мне нужно создать датафрейм в котором бы название колонок были названиями класса, а значения в них вероятностью (predict proba) для этого конкретного класса
источник

VP

Vladimir Popov in Python для анализа данных
Переслано от Vladimir Popov
Народ, помогите визуализировать решение задачи (и найти его).

Есть товар, стоит от 0 до 10М. Назовем М

На него продается два суб-товара: А и В

У А условия следующие: продавец обязан назначить стоимость за А процент i (не менее 1.5%, но может быть увеличен) от цены М, со стоимости А он получит 0.95%

У В условия другие: продавец обязан назначить стоимость за В не менее 0.03% от цены М, но может накинуть любую наценку.

Помогите построить кривую выгод так чтобы цена А или В не превысила 300к.
источник

IS

Ilya Shutov in Python для анализа данных
реально непонятно что же требуется.
по тексту видно, что продавцы вольны делать все что им вздумается.
без модели поведения продавца ничего не получится.
а с моделью напрашивается Монте-Карло

наблюдаю, что вопрос уже раз 5-ый редактируется...
источник

VP

Vladimir Popov in Python для анализа данных
Да, вы верно уловили, вопрос именно в постановке задачи.
источник