Size: a a a

ML Boot Camp Official

2020 November 12

MD

Mikhail Dektyarev in ML Boot Camp Official
Dmitry Sannikov
я вот думаю как технически такие вещи должны проверяться (автоматически)
по-хорошему новые данные
вашим методом можно просто старые данные пошафлить, вангую что это 99% COPY убьет
источник

SF

Sergei Fironov in ML Boot Camp Official
Миша
Интересно, а вдруг у кого-то модель примерно такая:
class MyModel:
   def __init__(self):
       self.result = [...]
   def predict(self, *_):
       return self.result
вот-вот, я судорожно вспоминаю, не было ли там оставлено COPY ) но в любом случае затирается
источник

MD

Mikhail Dektyarev in ML Boot Camp Official
Вячеслав Колосков
а кто нибудь переведите с докерского что тут написано :)
непереводимая игра слов
источник

SF

Sergei Fironov in ML Boot Camp Official
поэтому да, любые новые данные - отличная проверка
источник

М

Миша in ML Boot Camp Official
Внешне-то будет и joblib.load и model.predict
источник

SF

Sergei Fironov in ML Boot Camp Official
или старые с шафлом хотя бы. или их подмножество
источник

ДВ

Дима Васькин... in ML Boot Camp Official
Dmitry Sannikov
я вот думаю как технически такие вещи должны проверяться (автоматически)
Проскорить, поменяв порядок строк мб?
источник

SF

Sergei Fironov in ML Boot Camp Official
Дима Васькин
Проскорить, поменяв порядок строк мб?
угу, айдишники
источник

OC

Oleg Cheremisin in ML Boot Camp Official
не давать тест на руки (я думал, контейнерные соревы для этого и делаются)
источник

MD

Mikhail Dektyarev in ML Boot Camp Official
Sergei Fironov
или старые с шафлом хотя бы. или их подмножество
ну если кто-то написал модель
def predict(data):
   return [predicts[x['id']] for x in data]
то не спасет
но думаю таких моделей не очень много
хотя может быть и есть
источник

DS

Dmitry Sannikov in ML Boot Camp Official
Oleg Cheremisin
не давать тест на руки (я думал, контейнерные соревы для этого и делаются)
делаются, в этот раз дали так
источник

SF

Sergei Fironov in ML Boot Camp Official
Oleg Cheremisin
не давать тест на руки (я думал, контейнерные соревы для этого и делаются)
ну это изначально надо было делать
источник

MD

Mikhail Dektyarev in ML Boot Camp Official
Dmitry Sannikov
делаются, в этот раз дали так
а у вас на самом деле другие данные есть?
источник

DS

Dmitry Sannikov in ML Boot Camp Official
Mikhail Dektyarev
а у вас на самом деле другие данные есть?
придется делать
источник

DS

Dmitry Sannikov in ML Boot Camp Official
сделаю, залью
источник

М

Миша in ML Boot Camp Official
Sergei Fironov
или старые с шафлом хотя бы. или их подмножество
Старые с шафлом всё-таки тоже можно было предугадать и обмануть
Какой-нибудь
result_dict[text]
источник

М

Миша in ML Boot Camp Official
Mikhail Dektyarev
ну если кто-то написал модель
def predict(data):
   return [predicts[x['id']] for x in data]
то не спасет
но думаю таких моделей не очень много
хотя может быть и есть
Чёрт, как же я долго пишу))
источник

MD

Mikhail Dektyarev in ML Boot Camp Official
Dmitry Sannikov
придется делать
ну я вангую что почти все COPY убьются шафлом (не убьются только злонамеренные), и он (наверное) дешевый
источник

DS

Dmitry Sannikov in ML Boot Camp Official
Mikhail Dektyarev
ну я вангую что почти все COPY убьются шафлом (не убьются только злонамеренные), и он (наверное) дешевый
и это сделаю
источник

OC

Oleg Cheremisin in ML Boot Camp Official
Миша
Старые с шафлом всё-таки тоже можно было предугадать и обмануть
Какой-нибудь
result_dict[text]
написать проверку теста на руках с поданным и проверять построчно
источник