Size: a a a

Python для анализа данных

2021 September 16

М

Марк in Python для анализа данных
Привет) Чтобы не описывать проблему, держите сразу воспроизводимый пример) Вопрос какого фига NaN не отфильтровываются? Подкажите, плиз, как сделать так, чтобы их не было в результате?

a = pd.DataFrame({'col_1':[1, 2, np.nan, 4, 5],
                 'col_2':['a', 'b', 'c', 'd', 'e']})
b = pd.DataFrame({'col_1':[1, 2, np.nan, np.nan, 5],
                 'col_2':['a', 'b', 'c', 'd', 'e']})
b[b['col_1'].isin(a['col_1'])]
источник

М

Марк in Python для анализа данных
Вот 2 NaN появляются в этом примере, хотя очевидно, что их быть не должно))
источник

М

Марк in Python для анализа данных
Хотя, видимо это все таки типичное поведение. R тоже так делает. Никогда не замечал этого раньше)
источник

IS

Ilya Shutov in Python для анализа данных
у NaN есть свои правила поведения:
https://en.wikipedia.org/wiki/NaN
вне языкового контекста
источник

N

Nick in Python для анализа данных
Одна из гипотез, которые хочется проверить во время тестирования - компании, которые ориентированы на найм новичков, не имеют доступ к новичкам из-за высоких цен на job-порталах. Ведь если вы богатая контора - стоит ли нанимать новичков? Так что главное - честность. А люди разные нужны. Работодатели в тестировании реальные.
источник

DS

Dmitry Spodarets in Python для анализа данных
Всем привет!
Сегодня вечером вместе с Михаилом Рожковым из Iterative.ai будем говорить про DVC и переиспользование ML пайплайнов между проектами.
Присоединяйтесь - https://dataphoenix.info/webinar-re-usable-pipelines-for-ml-projects/
источник

VM

Valerii Mamontov in Python для анализа данных
Привет) Думаю, он и не должен их отфильтровывать.

import pandas as pd
import numpy as np

a = pd.DataFrame({'col_1':[1, 2, np.NaN, 4, 5],
                 'col_2':['a', 'b', 'c', 'd', 'e']})
b = pd.DataFrame({'col_1':[1, 2, np.nan, np.nan, 5],
                 'col_2':['a', 'b', 'c', 'd', 'e']})

items = a['col_1'].dropna(axis=0)
c = b[b['col_1'].isin(items)]
display(c)
источник

АМ

Алексей Макаров... in Python для анализа данных
🚀 Стартует совместный проект Solvery и Raiffeisen DGTL, где специалисты Raiffeisen предоставляют бесплатные карьерные и технические консультации для специалистов уровня Intern, Junior и Middle.

🤓 Мы считаем, что менторство - это наиболее эффективный инструмент карьерного развития, поэтому предоставляем уникальную возможность задать свои вопросы и бесплатно заниматься со специалистами Raiffeisen.

🔥 Если хочешь развиваться в профессии Data Science, то скорее записывайся на бесплатные занятия к менторам Raiffeisen, которые помогут тебе прокачаться!

С какими вопросами могут помочь менторы:

🎯 Освоить новую технологию
🎯 Найти работу в IT после пройденных курсов
🎯 Помочь с рабочей задачей
🎯 Подготовиться к собеседованию
🎯 Перейти на новый грейд
🎯 Сменить сферу деятельности
🎯 Рассказать просто о самом сложном

❓Как попасть на бесплатную сессию к ментору?
❗️Все очень просто! Переходишь по ссылке 👉https://solvery.io/ru/raiffeisen, выбираешь подходящего ментора и записываешься на занятие!

❗️Важно! Каждый ученик может заниматься до 4 часов с каждым ментором.
источник

VM

Valerii Mamontov in Python для анализа данных
Привет)
Хорошая идея со словарями. Думаю, будет достаточно одного словаря) Что-то типа такого:

# генерация случайных email-адресов и файлов
partners = ['albert.einstein', 'grisha_perelman' , 'alex.markov',
           'alexander_shen', 'mike_lermontov', 'katerina.shulman',
           'asya.kazanceva', 'l.ulitckaya']
emails = [p + '@mail.ru' for p in partners]
files = [f'000{i}.xlsx' for i in range(1, 9)]
# print(emails)
# print(files)

# генерация словаря
# address_gen = {emails[i]: files[i] for i in range(len(emails))}
# print(addres_gen)

address = {}
address['albert.einstein@mail.ru'] = files[:3]
address['alexander_shen@mail.ru'] = files[0]
address['katerina.shulman@mail.ru'] = files[3:6]

print(address)
# OUT:
# {'albert.einstein@mail.ru': ['0001.xlsx', '0002.xlsx', '0003.xlsx'],
#  'alexander_shen@mail.ru': '0001.xlsx',
#  'katerina.shulman@mail.ru': ['0004.xlsx', '0005.xlsx', '0006.xlsx']}
источник

А

Александр in Python для анализа данных
Спасибо, буду разбираться!
источник

VM

Valerii Mamontov in Python для анализа данных
1. можно разбить файлы на группы (папка1, папка2, папка2)
2. потом разбить адресатов на группы (папка1 - 10 человек, папка2 - 5 человек, папка3 - 7 человек)
3. сделать словарь "имя_папки": [список_адресатов]
источник

S

Somebody in Python для анализа данных
Или не искать мидла на зп джуна
источник

MD

M D in Python для анализа данных
+++
источник

J

Jay in Python для анализа данных
))))))))))
источник

IS

Ilya Shutov in Python для анализа данных
техническое интервью — вещь сложная и далеко не первый этап.
сколько вакансий, чтобы на тех.интервью пропустить 100 чел?
1? 10? 1000?

при таком потоке на первичном техническом фильтре в первые 5 минут можно составить мнение и в 90% случаев прекратить беседу. видимо hr не работают.

это же как на устном экзамене.
придумываете десяток вопросов из разных областей.
человек либо не знает, либо знает, но неправильно, либо знание его верное.
источник

М

Максим in Python для анализа данных
Ребята, подскажите, пжлста, простой вопрос по GA

Есть два запроса к GA:
1: request_body_landing = {
   'view_id': '244043787',
   'start_date': n_days_ago_string(2),
   'end_date': n_days_ago_string(2),
   'dimensions': {'ga:ClientID', 'ga:landingPagePath'},
   'metrics': {},
   'order':{'ga:desc'}
   }
2: request_body_page = {
   'view_id': '244043787',
   'start_date': n_days_ago_string(2),
   'end_date': n_days_ago_string(2),
   'dimensions': {'ga:ClientID', 'ga:PagePath'},
   'metrics': {},
   'order':{'ga:desc'}
   }
Получу ли я во втором запросе лендинги или они не включаются в PagePath?
источник

М

Марк in Python для анализа данных
Да уже разобрался, спасибо)
источник

М

Марк in Python для анализа данных
Спс)
источник

S

Somebody in Python для анализа данных
hr то что там могут?
источник

S

Somebody in Python для анализа данных
Скжите пжлумбста, что такое лнейнйа ргрссйя, отвечаешь не так, как у нее написано в скрипте и уходишь?
источник