Телеграмм чат группы pydata_chat страница 512

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Python для анализа данных

1689 membersпожаловаться на группу

2020 November 27

R

Ruslan in Python для анализа данных

Natalya Davydova

Есть показатель с вариантами типа "далеко", "близко", "на среднем расстоянии". И есть предположение, что от него зависит измеримый количественный показатель. Мне нужно проверить данную гипотезу.

Звучит как дисперсионный анализ

источник

19:25пожаловаться #1

R

Ruslan in Python для анализа данных

Если прям нужен стат метод

источник

19:25пожаловаться #2

R

Ruslan in Python для анализа данных

Ну либо взять если есть возможность показатель в динамике и проверить

источник

19:26пожаловаться #3

PZ

Pavel Zheltouhov in Python для анализа данных

Алексей Макаров

Ну вот если сейчас всё работает сравнительно неплохо и позволяет какие-то решения принимать, то тогда можно попробовать уже с LDA. Посмотреть что будет получатся

А дальше можно и на какие-то word embedding модели посмотреть, например, word2vec. Вот ещё статейка, где можно посмотреть примеры topic modelling с использованием word2vec

Topic Modelling in Python with NLTK and Gensim

In this post, we will learn how to identity which topic is discussed in a document, called topic modelling. In particular, we will cover…

что-то я не вижу в этой статье упоминания word2vec. Да и на память не припоминаю как его вместе с lda использовать. А как?

источник

19:56пожаловаться #4

АМ

Алексей Макаров... in Python для анализа данных

Pavel Zheltouhov

что-то я не вижу в этой статье упоминания word2vec. Да и на память не припоминаю как его вместе с lda использовать. А как?

Там юзается gensim, не совсем word2vec да, тут я ошибся, потому что в той статье, что я кинул конечно не word embeddings

источник

20:06пожаловаться #5

IS

Ivan Samorukov in Python для анализа данных

Если кому пригодится)

источник

20:09пожаловаться #6

IS

Ivan Samorukov in Python для анализа данных

Учишься, учишься и —ХОП! — получаешь призы

К Чёрной пятнице ребята из Практикума сделали конкурс: регистрируйтесь на курсы, проходите вводную часть бесплатно до 3 декабря и автоматически становитесь участником конкурса.

В призах:
• Мощный ноутбук, чтобы писать код.
• Яндекс.Станция, чтобы нейросеть вам помогала.
• Беспроводные наушники для прослушивания подкаста «Запуск завтра».
• Футболка Практикума.
• Трёхмесячная подписка на Яндекс.Плюс.

В конкурсе принимают участие: аналитики данных, веб-разработчики, Python-разработчики, специалисты по машинному обучению, инженеры по тестированию и дизайнеры интерфейсов.

источник

20:09пожаловаться #7

2020 November 28

KM

Konstantin Mohov in Python для анализа данных

Признавайтесь, кто ссылку чата куда кинул ?)))
Welcome !

источник

22:51пожаловаться #8

2020 November 29

s

ssv in Python для анализа данных

Кто объяснит, почему генерация в список бысртее, чем в массив?

источник

13:29пожаловаться #9

s

ssv in Python для анализа данных

%timeit listcol = [x for x in range(0,n)]
%timeit genexp = (x for x in range(0,n))
%timeit arr = ar('i', (x for x in range(0,n)))

источник

13:29пожаловаться #10

s

ssv in Python для анализа данных

138 ms ± 2.09 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
879 ns ± 7.72 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
250 ms ± 2.47 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

источник

13:30пожаловаться #11

s

ssv in Python для анализа данных

По занимаемой памяти еще как-то понятно

источник

13:30пожаловаться #12

s

ssv in Python для анализа данных

print(sys.getsizeof(listcol), sys.getsizeof(genexp), sys.getsizeof(arr))

источник

13:30пожаловаться #13

s

ssv in Python для анализа данных

8697464 88 4091932

источник

13:30пожаловаться #14

s

ssv in Python для анализа данных

Мол там плоское такое все и типизированное, но почему просадка по скорости?

источник

13:31пожаловаться #15

A

Alexander in Python для анализа данных

image_2020-11-29_21-45-19.png

Подскажите, пжлста, как внутри каждого региона присвоить ид всем округам от 1?

источник

21:45пожаловаться #16

A

Alexander in Python для анализа данных

Через rank что-то не то выдает

источник

21:45пожаловаться #17

A

Anton in Python для анализа данных

Может попробовать преобразовать таблицу через unstack и ввести индексы?

источник

22:01пожаловаться #18

S

Slavik in Python для анализа данных

Можно добавить колонку id через резет индекс

источник

22:04пожаловаться #19

S

Slavik in Python для анализа данных

Или создать столбец id и задать просто ему значения от 1 и до бесконечности) значения у каждого региона проставятся по порядку)

источник

22:06пожаловаться #20