Size: a a a

Python для анализа данных

2021 April 21

А

Алексей in Python для анализа данных
в Даталор?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
та хто ж знает что это. исследуйте
источник

PZ

Pavel Zheltouhov in Python для анализа данных
смотрите, библиотек 4 Supported engines: “xlrd”, “openpyxl”, “odf”, “pyxlsb”.

https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html
источник

А

Алексей in Python для анализа данных
в большинстве случаев используется openpyxl, потому что только она читает файл с версией эксель 2007+
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Это понятно. Вам же надо что-то делать, а не ждать. Я предлагаю экспериментировать с этим параметром
источник

А

Алексей in Python для анализа данных
я же говорю, что файл с расширением xlsx может читать только openpyxl engine
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Ну значит datalore жлобится относительно гугла
источник

s

slavapro in Python для анализа данных
Потому что csv это текстовый файл, а xlsx это архив
источник

А

Алексей in Python для анализа данных
ну понятно, что текстовый файл быстрее прочитается. Если быть точнее то это xml в архиве :)
источник

s

slavapro in Python для анализа данных
Так в чем странность? Архив и должен быть меньше
источник

А

Алексей in Python для анализа данных
ну получается, что да, несмотря на избыточность xml по отношению к csv, после сжатия xml, меньше csv
источник
2021 April 22

KM

Konstantin Mohov in Python для анализа данных
Вот статья недавно вышла

https://t.me/init_python/134
источник

ES

Ekaterina Savchenkov... in Python для анализа данных
Ребята, всем привет. Задание: найти сред.время жизни юзеров, которые выставили больше 100 оценок. Написала функцию, применила ее к df.  Меня смущают одинаковые значения в столбце mean_time. Может у меня в целом ход мысли неверный? Буду благодарна за любую подсказку
источник

SD

Stanislav Demchenko in Python для анализа данных
потому что у тебя max(ts) - min(ts) подсчитан и апплаем подсставлен каждому юзеру
источник

ES

Ekaterina Savchenkov... in Python для анализа данных
а как иначе нужно сделать? не может же быть, чтобы  у каждого юзера было одинаковое ср время
источник

SD

Stanislav Demchenko in Python для анализа данных
ты же можешь получить groupby(user)[timestamp].min() и max()
источник
2021 April 23

ES

Ekaterina Savchenkov... in Python для анализа данных
буду пробовать. спасибо)
источник

А

Александр in Python для анализа данных
Привет))
Ребят нужна помощь:
Есть таблица в ней данные о песнях исполнителях и рейтенге, данный за каждый год.
Задача найти кто из артистов дольше, непрерывно попадал в ТОП 100. Непрерывность определяется годами.
источник

А

Александр in Python для анализа данных
Вот так она выглядит, это только кусочек одного года https://prnt.sc/11wxjru
источник

А

Александр in Python для анализа данных
я не понимаю как именно задать условие "непрерывности"
источник