Телеграмм чат группы pydata_chat страница 916

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Python для анализа данных

2535 membersпожаловаться на группу

2021 September 16

М

Марк in Python для анализа данных

Привет) Чтобы не описывать проблему, держите сразу воспроизводимый пример) Вопрос какого фига NaN не отфильтровываются? Подкажите, плиз, как сделать так, чтобы их не было в результате?

a = pd.DataFrame({'col_1':[1, 2, np.nan, 4, 5],
                  'col_2':['a', 'b', 'c', 'd', 'e']})
b = pd.DataFrame({'col_1':[1, 2, np.nan, np.nan, 5],
                  'col_2':['a', 'b', 'c', 'd', 'e']})
b[b['col_1'].isin(a['col_1'])]

источник

12:46пожаловаться #1

М

Марк in Python для анализа данных

Вот 2 NaN появляются в этом примере, хотя очевидно, что их быть не должно))

источник

12:47пожаловаться #2

М

Марк in Python для анализа данных

Хотя, видимо это все таки типичное поведение. R тоже так делает. Никогда не замечал этого раньше)

источник

12:55пожаловаться #3

IS

Ilya Shutov in Python для анализа данных

у NaN есть свои правила поведения:
https://en.wikipedia.org/wiki/NaN
вне языкового контекста

NaN

value for unrepresentable data

источник

13:43пожаловаться #4

N

Nick in Python для анализа данных

Одна из гипотез, которые хочется проверить во время тестирования - компании, которые ориентированы на найм новичков, не имеют доступ к новичкам из-за высоких цен на job-порталах. Ведь если вы богатая контора - стоит ли нанимать новичков? Так что главное - честность. А люди разные нужны. Работодатели в тестировании реальные.

источник

13:48пожаловаться #5

DS

Dmitry Spodarets in Python для анализа данных

Всем привет!
Сегодня вечером вместе с Михаилом Рожковым из Iterative.ai будем говорить про DVC и переиспользование ML пайплайнов между проектами.
Присоединяйтесь - https://dataphoenix.info/webinar-re-usable-pipelines-for-ml-projects/

Webinar "Re-usable pipelines for ML projects with DVC"

Команда Data Phoenix Events приглашает всех, 16 сентября, на вебинар, который будет посвящен переиспользованию ML пайплайнов между проектами

источник

14:17пожаловаться #6

VM

Valerii Mamontov in Python для анализа данных

Привет) Думаю, он и не должен их отфильтровывать.

import pandas as pd
import numpy as np

a = pd.DataFrame({'col_1':[1, 2, np.NaN, 4, 5],
                  'col_2':['a', 'b', 'c', 'd', 'e']})
b = pd.DataFrame({'col_1':[1, 2, np.nan, np.nan, 5],
                  'col_2':['a', 'b', 'c', 'd', 'e']})

items = a['col_1'].dropna(axis=0)
c = b[b['col_1'].isin(items)]
display(c)

источник

15:44пожаловаться #7

АМ

Алексей Макаров... in Python для анализа данных

🚀 Стартует совместный проект Solvery и Raiffeisen DGTL, где специалисты Raiffeisen предоставляют бесплатные карьерные и технические консультации для специалистов уровня Intern, Junior и Middle.

🤓 Мы считаем, что менторство - это наиболее эффективный инструмент карьерного развития, поэтому предоставляем уникальную возможность задать свои вопросы и бесплатно заниматься со специалистами Raiffeisen.

🔥 Если хочешь развиваться в профессии Data Science, то скорее записывайся на бесплатные занятия к менторам Raiffeisen, которые помогут тебе прокачаться!

С какими вопросами могут помочь менторы:

🎯 Освоить новую технологию
🎯 Найти работу в IT после пройденных курсов
🎯 Помочь с рабочей задачей
🎯 Подготовиться к собеседованию
🎯 Перейти на новый грейд
🎯 Сменить сферу деятельности
🎯 Рассказать просто о самом сложном

❓Как попасть на бесплатную сессию к ментору?
❗️Все очень просто! Переходишь по ссылке 👉https://solvery.io/ru/raiffeisen, выбираешь подходящего ментора и записываешься на занятие!

❗️Важно! Каждый ученик может заниматься до 4 часов с каждым ментором.

источник

16:33пожаловаться #8

VM

Valerii Mamontov in Python для анализа данных

Привет)
Хорошая идея со словарями. Думаю, будет достаточно одного словаря) Что-то типа такого:

# генерация случайных email-адресов и файлов
partners = ['albert.einstein', 'grisha_perelman' , 'alex.markov', 
            'alexander_shen', 'mike_lermontov', 'katerina.shulman',
            'asya.kazanceva', 'l.ulitckaya']
emails = [p + '@mail.ru' for p in partners]
files = [f'000{i}.xlsx' for i in range(1, 9)]
# print(emails)
# print(files)

# генерация словаря
# address_gen = {emails[i]: files[i] for i in range(len(emails))}
# print(addres_gen)

address = {}
address['albert.einstein@mail.ru'] = files[:3]
address['alexander_shen@mail.ru'] = files[0]
address['katerina.shulman@mail.ru'] = files[3:6]

print(address)
# OUT:
# {'albert.einstein@mail.ru': ['0001.xlsx', '0002.xlsx', '0003.xlsx'],
#  'alexander_shen@mail.ru': '0001.xlsx',
#  'katerina.shulman@mail.ru': ['0004.xlsx', '0005.xlsx', '0006.xlsx']}

источник

16:34пожаловаться #9

А

Александр in Python для анализа данных

Спасибо, буду разбираться!

источник

16:44пожаловаться #10

VM

Valerii Mamontov in Python для анализа данных

1. можно разбить файлы на группы (папка1, папка2, папка2)
2. потом разбить адресатов на группы (папка1 - 10 человек, папка2 - 5 человек, папка3 - 7 человек)
3. сделать словарь "имя_папки": [список_адресатов]

источник

16:52пожаловаться #11

S

Somebody in Python для анализа данных

Или не искать мидла на зп джуна

источник

17:14пожаловаться #12

MD

M D in Python для анализа данных

+++

источник

17:32пожаловаться #13

J

Jay in Python для анализа данных

))))))))))

источник

17:39пожаловаться #14

IS

Ilya Shutov in Python для анализа данных

техническое интервью — вещь сложная и далеко не первый этап.
сколько вакансий, чтобы на тех.интервью пропустить 100 чел?
1? 10? 1000?

при таком потоке на первичном техническом фильтре в первые 5 минут можно составить мнение и в 90% случаев прекратить беседу. видимо hr не работают.

это же как на устном экзамене.
придумываете десяток вопросов из разных областей.
человек либо не знает, либо знает, но неправильно, либо знание его верное.

источник

17:46пожаловаться #15

М

Максим in Python для анализа данных

Ребята, подскажите, пжлста, простой вопрос по GA

Есть два запроса к GA:
1: request_body_landing = {
'view_id': '244043787',
'start_date': n_days_ago_string(2),
'end_date': n_days_ago_string(2),
'dimensions': {'ga:ClientID', 'ga:landingPagePath'},
'metrics': {},
'order':{'ga:desc'}
}
2: request_body_page = {
'view_id': '244043787',
'start_date': n_days_ago_string(2),
'end_date': n_days_ago_string(2),
'dimensions': {'ga:ClientID', 'ga:PagePath'},
'metrics': {},
'order':{'ga:desc'}
}
Получу ли я во втором запросе лендинги или они не включаются в PagePath?

источник

17:56пожаловаться #16

М

Марк in Python для анализа данных

Да уже разобрался, спасибо)

источник

18:11пожаловаться #17

М

Марк in Python для анализа данных

Спс)

источник

18:11пожаловаться #18

S

Somebody in Python для анализа данных

hr то что там могут?

источник

18:43пожаловаться #19

S

Somebody in Python для анализа данных

Скжите пжлумбста, что такое лнейнйа ргрссйя, отвечаешь не так, как у нее написано в скрипте и уходишь?

источник

18:45пожаловаться #20