Телеграмм чат группы pydata

Всем привет! Поправьте пжл в коде
исходный df:

id month text (тип str)
0 7 Feb def
1 2 Oct ss
2 7 Jan abc
3 2 Nov klo

Нужно получить: new df (сложить значение строк по id в порядке последовательности месяцев)
id result
0 7 abcdef
1 2 ssklo

Пробую так:
df_new = df.groupby('id')['text'].apply(list).reset_index(name='result')
но получается с ошибкой в результате:
id result
0 7 defabc
1 2 ssklo

Подскажите пжл как поправить синтаксис чтобы в нужном порядке соединялись ячейки 😊

источник

13:34пожаловаться #7

Pavel Zheltouhov in Python для анализа данных

ну да, есть поток отдельный.
ну попробуйте убрать ее.

источник

13:35пожаловаться #8

ПС

Петр Скуратов... in Python для анализа данных

Убрал, одна ошибка упала, другая осталась.
Импортирую только это, ничего многопоточного не использую

источник

13:55пожаловаться #9

ПС

Петр Скуратов... in Python для анализа данных

источник

13:55пожаловаться #10

Pavel Zheltouhov in Python для анализа данных

короче, вы вопрос про core решили игнорировать? ну ок.

источник

13:56пожаловаться #11

ПС

Петр Скуратов... in Python для анализа данных

Я немного не понял, что за файл core?

источник

13:56пожаловаться #12

Pavel Zheltouhov in Python для анализа данных

Память на сердечниках) . жаргон такой

когда программа "падает", должен образоваться файл core, который представляет собой слепок памяти в этот момент.
вот его можно через gdb проанализировать.
не факт что получится самому разобраться, но stack trace подсказывает последовательность и названия вызовов машинного кода, из которого тоже можно делать предположения не будучи программистом на Си. Довольно часто это работает. Во всяком случае, будет что погуглить более конкретно по названию функций.

если это все слишком сложно, можете просто перебирать разные варианты окружения. у людей ведь как-то работает, значит ваша проблема сравнительно редкая и зависит от условий. Например, да, от объема памяти. или конкретной фоточки

источник

14:00пожаловаться #13

Ilya Shutov in Python для анализа данных

Павел, если Вам просто нужно прогнать по большому числу фотографий и не хочется погружаться в код модулей — просто побейте все файлы на приемлемые блоки (ну по 5К фото).
И в командной строке позапускайте последовательно эти блоки в чистых сессиях. Дешево и сердито.

искать утечки — крайне неблагодарное занятие.

источник

14:31пожаловаться #14

Mikhail in Python для анализа данных

источник

15:01пожаловаться #15

Елена in Python для анализа данных

Спасибо Михаил) Попробовала ваш вариант. Всё хорошо, только у меня ячейки всё равно соединяются по порядку индексов записей, а не в последовательности месяцев. Пробовала сортировать month(Jan, Feb, Apr…) через календарь , и после group by опять слетает сортировка.

источник

15:24пожаловаться #16

Mikhail in Python для анализа данных

если использовали sort_values, то groupby должен сохранять порядок сортировки внутри группы

источник

15:26пожаловаться #17

D. K. in Python для анализа данных

что я делаю не так? как работает здесь ранк? я ожидал там результат по типу row_number по значениям поля stage_cnt

источник

16:49пожаловаться #18

PAWPAW in Python для анализа данных

Всем привет, подскажите как мне из 1 варианта иерархии товаров прийти ко 2.
product_name у меня бывает больше чем 1 значение
Гуглил про
•DataFrame.stack()
•DataFrame.unstack()DataFrame.stack()
•DataFrame.unstack()
но не понимаю в какой последовательности все сделать

источник

18:44пожаловаться #19

@RAM@ in Python для анализа данных

df = df.rename(columns={('check',''):'check'})

А если так попробовать для каждого

источник

19:18пожаловаться #20