Телеграмм чат группы devops

inference в общем случае достаточно легковесен, его регулярно делают на клиентах, но можно опять же на gpu на серверной части ранать если нужно большой поток обрабатывать

источник

15:01пожаловаться #6

Nikita Burtsev in DevOps — русскоговорящее сообщество

если inference можно куда-то еще отдать а новая модель тренируется не так часто никто не мешает у того же амазона брать gpu instances on-demand или scheduled reserved

источник

15:02пожаловаться #7

If you can do it bet... in DevOps — русскоговорящее сообщество

а какая часовая стоимость ?

источник

15:02пожаловаться #8

If you can do it bet... in DevOps — русскоговорящее сообщество

оно дороже?

источник

15:03пожаловаться #9

Nikita Burtsev in DevOps — русскоговорящее сообщество

p3.2x стоит $3 в час on-demand, там внутри tesla v100

источник

15:05пожаловаться #10

If you can do it bet... in DevOps — русскоговорящее сообщество

это эквивалентво 64 cores сорри за тупые вопросы

источник

15:05пожаловаться #11

If you can do it bet... in DevOps — русскоговорящее сообщество

источник

15:05пожаловаться #12

Nikita Burtsev in DevOps — русскоговорящее сообщество

такая карта в ai бенчмарках выдает 35000 попугаев. Intel Xeon Gold 6148 в котором 20 физических ядер на том же тесте выдает 4000 попугаев. т.е. в целом одна карточка условно эквивалентна 160 физическим ядрам

источник

15:06пожаловаться #13

If you can do it bet... in DevOps — русскоговорящее сообщество

Nikita Burtsev

спасибо огромное за обьяснение

источник

15:08пожаловаться #14

Nikita Burtsev in DevOps — русскоговорящее сообщество

training score 17000 vs 1700, inference score 17000 vs 2600 . т.е. тренирует в 10 раз быстрее, выполняет в 6 с копейками раз быстрее

источник

15:08пожаловаться #15

If you can do it bet... in DevOps — русскоговорящее сообщество