Size: a a a

Machine learning

2020 December 01

i

igor in Machine learning
Нормализации устоявшийся термин
источник

P

Pavel in Machine learning
подскажите, можно ли как-то в pandas сделать drop_duplicates, но дропнуть не все дубликаты, а только часть? например, если дубликатов больше 5, то дропнуть остальные, а если меньше, то ничего не делать
источник

i

igor in Machine learning
Возможно нормализация это переход именно к нормальному распределению, а стандартизация более общее понятие
источник

i

igor in Machine learning
это от слова норма но это не важно
источник

i

igor in Machine learning
Нормализация\стандартизация\масшабирования готовят данные
источник

i

igor in Machine learning
регуляризация стражается  с оверфитингом
источник

i

igor in Machine learning
Это как служба тыла и ударные войска
источник

i

igor in Machine learning
Не с регуляризацией понятно что это другое совсем
источник

i

igor in Machine learning
Тогда все правы ;)
источник

AR

Anton Rogozin in Machine learning
Pavel
подскажите, можно ли как-то в pandas сделать drop_duplicates, но дропнуть не все дубликаты, а только часть? например, если дубликатов больше 5, то дропнуть остальные, а если меньше, то ничего не делать
Хм, вроде нет такого в параметрах. Перед самым началом сделать groupby по первичному ключу, получив индексы, по которым можно получить два датасета:
- один с малым количеством дубликатов: меньше 5, такие записи не трогаем
- в другом лежат записи, у которых дублей больше 5. Такие записи дропаем и оставляет только один дубль

После эти два датафрейма конкатенируем
источник

RS

Renat Shakirov in Machine learning
а тут есть люди которые разбираются в О больше или о малое?
источник

i

igor in Machine learning
Тут много таких
источник

P

Pavel in Machine learning
Anton Rogozin
Хм, вроде нет такого в параметрах. Перед самым началом сделать groupby по первичному ключу, получив индексы, по которым можно получить два датасета:
- один с малым количеством дубликатов: меньше 5, такие записи не трогаем
- в другом лежат записи, у которых дублей больше 5. Такие записи дропаем и оставляет только один дубль

После эти два датафрейма конкатенируем
спасибо!
источник

RS

Renat Shakirov in Machine learning
источник

RS

Renat Shakirov in Machine learning
Не знаю правильно ли это выражение написано
источник

RS

Renat Shakirov in Machine learning
у О большого нестрогое неравенство
источник

RS

Renat Shakirov in Machine learning
по сути логарифм сразу обрезает число и оно всегда будет меньше правой
источник

IK

Ivan Krokhalyov in Machine learning
Неправильно, то что слева это 2log(n)+n*log(3). Главный член это n
источник

IK

Ivan Krokhalyov in Machine learning
Значит O(n)
источник

RS

Renat Shakirov in Machine learning
окей, спасибо
источник