Size: a a a

Python для анализа данных

2021 October 18

ПС

Петр Скуратов... in Python для анализа данных
Спасибо, покопаюсь)
источник

ПС

Петр Скуратов... in Python для анализа данных
источник

ПС

Петр Скуратов... in Python для анализа данных
Ошибка происходит на этой функции
boxes = face_recognition.face_locations(rgb, model='cnn')
источник

PZ

Pavel Zheltouhov in Python для анализа данных
а что приложение многотредное чтоли?
источник

ПС

Петр Скуратов... in Python для анализа данных
Использую библиотеку tqdm, возможно она запускает многотред
источник

PZ

Pavel Zheltouhov in Python для анализа данных
да вроде не должна.

так есть  файл core или нет?
источник

Е

Елена in Python для анализа данных
Всем привет! Поправьте пжл в коде
исходный df:

    id     month     text (тип str)
0   7         Feb          def
1   2         Oct            ss
2   7          Jan           abc
3   2          Nov         klo

Нужно получить: new df (сложить значение строк по id в порядке    последовательности месяцев)
    id             result
0   7              abcdef
1   2              ssklo    

Пробую так:
df_new = df.groupby('id')['text'].apply(list).reset_index(name='result')
но получается с ошибкой в результате:
id             result
0   7           defabc  
1   2           ssklo

Подскажите пжл как поправить синтаксис чтобы в нужном порядке соединялись ячейки 😊
источник

PZ

Pavel Zheltouhov in Python для анализа данных
ну да, есть поток  отдельный.
ну попробуйте убрать ее.
источник

ПС

Петр Скуратов... in Python для анализа данных
Убрал, одна ошибка упала, другая осталась.
Импортирую только это, ничего многопоточного не использую
источник

ПС

Петр Скуратов... in Python для анализа данных
источник

PZ

Pavel Zheltouhov in Python для анализа данных
короче, вы вопрос про core решили игнорировать? ну ок.
источник

ПС

Петр Скуратов... in Python для анализа данных
Я немного не понял, что за файл core?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Память на сердечниках) . жаргон такой

когда программа "падает", должен образоваться файл core, который представляет собой слепок памяти в этот момент.
вот его можно через gdb проанализировать.
не факт что получится самому разобраться, но  stack trace  подсказывает последовательность и названия вызовов машинного кода, из которого тоже можно делать предположения не будучи программистом на Си. Довольно часто это работает. Во всяком случае, будет что погуглить более конкретно по названию функций.

если это все слишком сложно, можете просто перебирать разные варианты окружения. у людей ведь как-то работает, значит ваша проблема сравнительно редкая и зависит от условий. Например, да, от объема памяти. или конкретной фоточки
источник

IS

Ilya Shutov in Python для анализа данных
Павел, если Вам просто нужно прогнать по большому числу фотографий и не хочется погружаться в код модулей — просто побейте все файлы на приемлемые блоки (ну по 5К фото).
И в командной строке позапускайте последовательно эти блоки в чистых сессиях. Дешево и сердито.

искать утечки — крайне неблагодарное занятие.
источник

M

Mikhail in Python для анализа данных
источник

Е

Елена in Python для анализа данных
Спасибо Михаил) Попробовала ваш вариант. Всё хорошо, только у меня ячейки всё равно соединяются по порядку индексов записей, а не в последовательности месяцев. Пробовала сортировать month(Jan, Feb, Apr…) через календарь , и после group by опять слетает сортировка.
источник

M

Mikhail in Python для анализа данных
если использовали sort_values, то groupby должен сохранять порядок сортировки внутри группы
источник

DK

D. K. in Python для анализа данных
что я делаю не так? как работает здесь ранк? я ожидал там результат по типу row_number по значениям поля stage_cnt
источник

P

PAWPAW in Python для анализа данных
Всем привет, подскажите как мне из 1 варианта иерархии товаров прийти ко 2.
product_name у меня бывает больше чем 1 значение
Гуглил про
•DataFrame.stack()
•DataFrame.unstack()
DataFrame.stack()
DataFrame.unstack()
но не понимаю в какой последовательности все сделать
источник

@

@RAM@ in Python для анализа данных
df = df.rename(columns={('check',''):'check'})

А если так попробовать для каждого
источник