Телеграмм чат группы datasciencecourse страница 4419

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

7650 membersпожаловаться на группу

2020 December 01

i

igor in Machine learning

Нормализации устоявшийся термин

источник

13:18пожаловаться #1

P

Pavel in Machine learning

подскажите, можно ли как-то в pandas сделать drop_duplicates, но дропнуть не все дубликаты, а только часть? например, если дубликатов больше 5, то дропнуть остальные, а если меньше, то ничего не делать

источник

13:19пожаловаться #2

i

igor in Machine learning

Возможно нормализация это переход именно к нормальному распределению, а стандартизация более общее понятие

источник

13:19пожаловаться #3

i

igor in Machine learning

это от слова норма но это не важно

источник

13:23пожаловаться #4

i

igor in Machine learning

Нормализация\стандартизация\масшабирования готовят данные

источник

13:23пожаловаться #5

i

igor in Machine learning

регуляризация стражается с оверфитингом

источник

13:23пожаловаться #6

i

igor in Machine learning

Это как служба тыла и ударные войска

источник

13:23пожаловаться #7

i

igor in Machine learning

Не с регуляризацией понятно что это другое совсем

источник

13:24пожаловаться #8

i

igor in Machine learning

Тогда все правы ;)

источник

13:28пожаловаться #9

AR

Anton Rogozin in Machine learning

подскажите, можно ли как-то в pandas сделать drop_duplicates, но дропнуть не все дубликаты, а только часть? например, если дубликатов больше 5, то дропнуть остальные, а если меньше, то ничего не делать

Хм, вроде нет такого в параметрах. Перед самым началом сделать groupby по первичному ключу, получив индексы, по которым можно получить два датасета:
- один с малым количеством дубликатов: меньше 5, такие записи не трогаем
- в другом лежат записи, у которых дублей больше 5. Такие записи дропаем и оставляет только один дубль

После эти два датафрейма конкатенируем

источник

14:21пожаловаться #10

RS

Renat Shakirov in Machine learning

а тут есть люди которые разбираются в О больше или о малое?

источник

15:38пожаловаться #11

i

igor in Machine learning

Тут много таких

источник

16:10пожаловаться #12

P

Pavel in Machine learning

Хм, вроде нет такого в параметрах. Перед самым началом сделать groupby по первичному ключу, получив индексы, по которым можно получить два датасета:
- один с малым количеством дубликатов: меньше 5, такие записи не трогаем
- в другом лежат записи, у которых дублей больше 5. Такие записи дропаем и оставляет только один дубль

После эти два датафрейма конкатенируем

спасибо!

источник

16:13пожаловаться #13

RS

Renat Shakirov in Machine learning

источник

16:40пожаловаться #14

RS

Renat Shakirov in Machine learning

Не знаю правильно ли это выражение написано

источник

16:40пожаловаться #15

RS

Renat Shakirov in Machine learning

у О большого нестрогое неравенство

источник

16:41пожаловаться #16

RS

Renat Shakirov in Machine learning

по сути логарифм сразу обрезает число и оно всегда будет меньше правой

источник

16:42пожаловаться #17

IK

Ivan Krokhalyov in Machine learning

Неправильно, то что слева это 2log(n)+n*log(3). Главный член это n

источник

16:43пожаловаться #18

IK

Ivan Krokhalyov in Machine learning

Значит O(n)

источник

16:43пожаловаться #19

RS

Renat Shakirov in Machine learning

окей, спасибо

источник

16:44пожаловаться #20