Size: a a a

2021 November 03

ЕГ

Евгений Глотов... in Data Engineers
источник

V

Vladislav Gotsulyak in Data Engineers
источник

ЕГ

Евгений Глотов... in Data Engineers
Не, ну новые базы-то всё это поддерживают через pyarrow
источник

DZ

Dmitry Zuev in Data Engineers
что это?
источник

ЕГ

Евгений Глотов... in Data Engineers
Скоринг распределённый
источник

ЕГ

Евгений Глотов... in Data Engineers
Не знаю насчёт обучения
источник

DZ

Dmitry Zuev in Data Engineers
сам инфиренс?
источник

ЕГ

Евгений Глотов... in Data Engineers
Да
источник

AS

Andrey Smirnov in Data Engineers
Так сам инференс не проблема (если модель в память помещается)
источник

ЕГ

Евгений Глотов... in Data Engineers
Что значит не проблема?
источник

AS

Andrey Smirnov in Data Engineers
Проблема именно в  распределённом обучении
источник

AS

Andrey Smirnov in Data Engineers
Pandas udf
источник

ЕГ

Евгений Глотов... in Data Engineers
Это для спарка не проблема)
источник

AS

Andrey Smirnov in Data Engineers
Тогда сорри, не так понял
источник

ЕГ

Евгений Глотов... in Data Engineers
А распределённый бустинг это одна большая проблема
источник

ЕГ

Евгений Глотов... in Data Engineers
Либо качество хуже, чем у локального, либо работает за такое же время на 5 нодах, как локальный на одной, либо вообще дичь какая-то)
источник

UD

Uncel Duk in Data Engineers
Зависит от фантазии художника
источник

UD

Uncel Duk in Data Engineers
В среднем по больнице xgboost go brr
источник

UD

Uncel Duk in Data Engineers
при условии что у вас инфратоврищи не щелкают клювом
источник

UD

Uncel Duk in Data Engineers
и их руководство тоже
источник