Size: a a a

Machine learning

2021 January 03

DP

Dmitry Penzar in Machine learning
Переслано от Dmitry Penzar
scikit-learn - ROC curve with confidence intervals - Stack Overflow
https://stackoverflow.com/questions/19124239/scikit-learn-roc-curve-with-confidence-intervals
источник

МД

Михаил Дементиенко... in Machine learning
Прошел все задания 1 курса. Жду оценки последней работы. Когда сформируется сертификат?
источник

А

Артем in Machine learning
Михаил Дементиенко
Прошел все задания 1 курса. Жду оценки последней работы. Когда сформируется сертификат?
После оценки всех работ, необходимых для получения сертификата
источник

МД

Михаил Дементиенко... in Machine learning
Спасибо
источник
2021 January 04

АГ

Артём Глазунов... in Machine learning
Dmitry Penzar
А любой тест предполагающий независимость будет нехорош, да
То есть, формально, для проверки гипотез о равенство средних значений  метрик на тесте для двух разных моделей (корректные, гипотез о равном качестве моделей на тесте) с использованием repeated stratified k fold класс непараметрических критериев должен подходить, правильно я понимаю? К примеру, Манна-Уитни или перестановочный критерий. Ну, и как вами отмечалось выше, ещё и бутстрап дов интервалы дополнительно можно сравнить для двух моделей, посмотреть, нет ли пересечения.
источник

АГ

Артём Глазунов... in Machine learning
Ну, чтобы не вводить никого в заблуждение, там проверка не всегда на равенство средних, для независимых выборок проверка на относительную несмещенность распределений, а для зависимых в случае Манна Уитни - проверяется равенство нулю разности медиан, если я все правильно помню.
источник

ДС

Дмитрий Савченко... in Machine learning
Michael Lensky
C2W3 задание по программированию. grid_cv_zeros = GridSearchCV(classifier_zeros, param_grid, cv = 3)
grid_cv_means.fit(learn_means, y_train) пишет ошибку, что TOTAL NO. of ITERATIONS REACHED LIMIT.  подскажие, плиз, ка быть)
ответили как вылечить?
источник

ДС

Дмитрий Савченко... in Machine learning
Michael Lensky
C2W3 задание по программированию. grid_cv_zeros = GridSearchCV(classifier_zeros, param_grid, cv = 3)
grid_cv_means.fit(learn_means, y_train) пишет ошибку, что TOTAL NO. of ITERATIONS REACHED LIMIT.  подскажие, плиз, ка быть)
вылечил у себя изменив параметр
источник

PS

Pavel Savin in Machine learning
Артём Глазунов
Ну, чтобы не вводить никого в заблуждение, там проверка не всегда на равенство средних, для независимых выборок проверка на относительную несмещенность распределений, а для зависимых в случае Манна Уитни - проверяется равенство нулю разности медиан, если я все правильно помню.
У Манна-Уитни, кажется, альтернатива это сдвиг распределения на константу, так что его тоже надо осторожно применять
источник

АГ

Артём Глазунов... in Machine learning
Pavel Savin
У Манна-Уитни, кажется, альтернатива это сдвиг распределения на константу, так что его тоже надо осторожно применять
Это да, и не только у него, но и у перестановочного для независимых выборок. Вопрос мой был в корректности такого подхода как такового к данной задаче, потому что нужно получать p value, а т тест не очень корректен в связи с зависимостью испытаний.
источник

DP

Dmitry Penzar in Machine learning
Артём Глазунов
То есть, формально, для проверки гипотез о равенство средних значений  метрик на тесте для двух разных моделей (корректные, гипотез о равном качестве моделей на тесте) с использованием repeated stratified k fold класс непараметрических критериев должен подходить, правильно я понимаю? К примеру, Манна-Уитни или перестановочный критерий. Ну, и как вами отмечалось выше, ещё и бутстрап дов интервалы дополнительно можно сравнить для двух моделей, посмотреть, нет ли пересечения.
в допущения маннуитни/вилкоксона тоже входит независимость наблюдений, потому есть подозрение, что нельзя и его
источник

АГ

Артём Глазунов... in Machine learning
Dmitry Penzar
в допущения маннуитни/вилкоксона тоже входит независимость наблюдений, потому есть подозрение, что нельзя и его
То есть остаётся только перестановочный критерий и проверка гипотез на основе бутстрапа... Хотя не совсем очевидно, где в U критерии такое допущение об iid, во всех моих источниках будто избегают говорить про iid. Может посоветуете норм источник, где наиболее строго подаётся все про критерии, дов интервалы и про бутстрап? Спасибо
источник

DP

Dmitry Penzar in Machine learning
У меня было подозрение, что это так, ибо независимость очень частое требование.
И я просто загуглил. https://statistics.laerd.com/statistical-guides/mann-whitney-u-test-assumptions.php

Обычно я гуглю, именно учебник посоветовать не смогу
источник

АГ

Артём Глазунов... in Machine learning
Dmitry Penzar
У меня было подозрение, что это так, ибо независимость очень частое требование.
И я просто загуглил. https://statistics.laerd.com/statistical-guides/mann-whitney-u-test-assumptions.php

Обычно я гуглю, именно учебник посоветовать не смогу
Спасибо
источник

АГ

Артём Глазунов... in Machine learning
Dmitry Penzar
У меня было подозрение, что это так, ибо независимость очень частое требование.
И я просто загуглил. https://statistics.laerd.com/statistical-guides/mann-whitney-u-test-assumptions.php

Обычно я гуглю, именно учебник посоветовать не смогу
Заглянул в пару учебников по бустрапу, там тоже во всех теоремах iid, хотя и пишут, что метод обобщается на not iid... Получается, все равно, вероятно, некорректно напрямую использовать конф интервалы для той задачи...
источник

AO

Alex Ololo in Machine learning
К-s как- то неск месяцев назад искал что то похожее про бутстрап
источник

АГ

Артём Глазунов... in Machine learning
источник

АГ

Артём Глазунов... in Machine learning
Alex Ololo
К-s как- то неск месяцев назад искал что то похожее про бутстрап
Вот сижу сейчас, думаю, как корректно проинтерпретировать результаты кросс-валидации для 2-х моделей)
источник

АГ

Артём Глазунов... in Machine learning
Руки так и чешутся что-то из известного применить, но iid  нужен везде)
источник

i

igor in Machine learning
Конечная проверка это тестовые данные это ай ай ди
источник