Size: a a a

Python для анализа данных

2021 October 03

IS

Ilya Shutov in Python для анализа данных
Кумсум, кстати, далеко не во всех базах есть
источник

M

Mikhail in Python для анализа данных
ну нету только в тех которые не поддерживают оконки
источник

M

Mikhail in Python для анализа данных
это может быть не последний шаг в вычислении)
источник

IS

Ilya Shutov in Python для анализа данных
Тут мы ушли далеко от исходной задачи и придумывать допущения не хочется.

Итог: предложено два подхода, оба быстрее на 3-4 порядка. Исходный вариант решения — классический пример того, как не надо делать.

Fin
источник
2021 October 04

К

Карась судьбы... in Python для анализа данных
Всем привет, подскажите, пожалуйста, как можно удалить часть строки в колонке, если я знаю чем она заканчивается.
я пытаюсь использовать map и rstrip, но возникает проблема с последним элементом, который может быть разным

df['type'].map(lambda x: x.rstrip('class + [A-Z]'))

строчка может оканчиваться какой-то одной из букв н-р "class A" или "class B",
источник

IS

Ilya Shutov in Python для анализа данных
Замена с помощью регулярок
источник

M

Mikhail in Python для анализа данных
df['type'].str.replace('class [A-Z]$', '', regex=True)
источник

В

Виктория in Python для анализа данных
Всем привет! Подскажите, считаю корреляцию, но выдает значения NaN. Может ли быть дело в большом числа GDP или дело в том, что имеются NaN в данных ? Хотя в других случаях все считается. Буду рада идеям как избавиться от NaN и получить числа...

Скрин 1 - таблица с корреляцией, скрин 2 - данные из основного дф
источник

В

Виктория in Python для анализа данных
источник

M

Mikhail in Python для анализа данных
Это у кого-это gdp измеряется десятками триллионов и известно до 4 десятичных знаков?)))
источник

M

Mikhail in Python для анализа данных
Попробуйте считать в миллионах, думаю там вполне может в нативном коде какой-то оверфлоу быть
источник

В

Виктория in Python для анализа данных
Выгрузка из базы… может выгрузила не так))
источник

M

Mikhail in Python для анализа данных
Не, у США как раз 20 трлн, но вопрос откуда такая точность)
источник

В

Виктория in Python для анализа данных
worldbank использовала для выгрузки, там что было то имеется..
источник

M

Mikhail in Python для анализа данных
Ну разделите на миллиард
источник

M

Mikhail in Python для анализа данных
И остальные корреляции подозрительные))
источник

К

Карась судьбы... in Python для анализа данных
спасибо
источник

В

Виктория in Python для анализа данных
Остальные там какие данные дали, такие и есть))
Это тестовое

Про разделить поняла, будем пробовать, спасибо 🙏🏼
источник

В

Виктория in Python для анализа данных
Там просто данных мало, проверяют, думаю, больше умение, а не точность чисел
источник

В

Виктория in Python для анализа данных
Деление не помогло, все еще NaN. Заменила пропуски на средние, мало ли в них проблемы, тоже ничего, эх)
Будем думать, будем думать...
источник