Size: a a a

2020 October 29

AZ

Anton Zadorozhniy in Data Engineers
XAI это большая тема, там есть определенные подвижки (LRP к примеру), но общих хороших методов нет, поэтому в ряде отраслей к ним нельзя прикасаться
источник

АЖ

Андрей Жуков... in Data Engineers
Вообще если есть бюджет на переписывание, то почему бы и нет

Но обычно нет лишнего человеко-месяца
источник

AZ

Anton Zadorozhniy in Data Engineers
GDPR утвердил right for explanation) но только на уровне конкретного решения (то что называется local interpretability), а не общее объяснение модели
источник

R

Renarde in Data Engineers
Anton Zadorozhniy
GDPR утвердил right for explanation) но только на уровне конкретного решения (то что называется local interpretability), а не общее объяснение модели
Shap вполне решает эту задачу, разве нет?
источник

AZ

Anton Zadorozhniy in Data Engineers
Renarde
Shap вполне решает эту задачу, разве нет?
какую эту?
источник

AZ

Anton Zadorozhniy in Data Engineers
если речь про локальное объяснение - то да, шап для него подходит, и может дать веса на тестовом наборе (только kernelexplainer/deepexplainer довольно дорогие, они по сути инферят по каждой строке), но это не решает задачу объяснения в общем виде, так как такое объяснение хорошо настолько, насколько хорош тестовый набор
источник

AA

Anton Alekseev in Data Engineers
Renarde
Shap вполне решает эту задачу, разве нет?
как и LIME, но я так понял Антон не про импакты и принцип принятия решения на тесте.
источник

AA

Anton Alekseev in Data Engineers
Anton Zadorozhniy
если речь про локальное объяснение - то да, шап для него подходит, и может дать веса на тестовом наборе (только kernelexplainer/deepexplainer довольно дорогие, они по сути инферят по каждой строке), но это не решает задачу объяснения в общем виде, так как такое объяснение хорошо настолько, насколько хорош тестовый набор
Ну тогда мы не можем вообще никаких техник из мл и статистики касаться, исходный генератор мы только аппроксимируем на основе выборки.
источник

AZ

Anton Zadorozhniy in Data Engineers
Anton Alekseev
Ну тогда мы не можем вообще никаких техник из мл и статистики касаться, исходный генератор мы только аппроксимируем на основе выборки.
да, и отсюда все разговоры про предвзятость, если генератор (и аппроксимация) предвзятые - то и модель предвзятая, и на объяснении этого видно не будет
источник

AE

Alexey Evdokimov in Data Engineers
заказчикам почему-то не нравится, когда результат работы алгоритма на проде в прямой, но непонятной зависимости от датасета, на котором обучали
источник

AE

Alexey Evdokimov in Data Engineers
или даже от порядка данных в этом датасете
источник

AZ

Anton Zadorozhniy in Data Engineers
Alexey Evdokimov
заказчикам почему-то не нравится, когда результат работы алгоритма на проде в прямой, но непонятной зависимости от датасета, на котором обучали
тут разные заказчики есть, кому-то наплевать, главное чтобы результаты показывало хорошие
источник

AA

Anton Alekseev in Data Engineers
Anton Zadorozhniy
да, и отсюда все разговоры про предвзятость, если генератор (и аппроксимация) предвзятые - то и модель предвзятая, и на объяснении этого видно не будет
справедливо, поэтому данные нуждаются в валидации и сэмплировании и тд, для уменьшения ошибки + оптимизация модели со временем и новыми данными.
источник

AE

Alexey Evdokimov in Data Engineers
и попробуй объясни, почему результат такой, а не тот, которые его аналитики нашли
источник

AE

Alexey Evdokimov in Data Engineers
и который исторически кажется более правдоподобным
источник

AZ

Anton Zadorozhniy in Data Engineers
Anton Alekseev
справедливо, поэтому данные нуждаются в валидации и сэмплировании и тд, для уменьшения ошибки + оптимизация модели со временем и новыми данными.
все так
источник

AE

Alexey Evdokimov in Data Engineers
с обычными-то эвристиками расписывать приходится, как матчинг в каждом конкретном кейсе происходит, а уж если чёрный ящик типа нейронки, там фиг что докажешь
источник

AS

Andrey Smirnov in Data Engineers
Alexey Evdokimov
заказчикам почему-то не нравится, когда результат работы алгоритма на проде в прямой, но непонятной зависимости от датасета, на котором обучали
а почему, это же наоборот идеальный кейс, хуже когда на проде меняется характер данных, и модель начинает выдавать хрень
источник

AS

Andrey Smirnov in Data Engineers
Alexey Evdokimov
и попробуй объясни, почему результат такой, а не тот, которые его аналитики нашли
потомки лудитов?
источник

AE

Alexey Evdokimov in Data Engineers
нет, просто модель есть модель. иногда она выдаёт какие-то решения просто потому что
источник