Телеграмм чат группы bigdata

я использовал хоровод для обучениях на несокльких видеокартах. по итогу получается аналог батч сайз. я сейчас немного другое ищу, мне памяти не хватает. возможно можно одной GPU считать используя память всех видях

источник

11:21пожаловаться #5

AS

Alex Surname in AI / Big Data / Machine Learning

Alexei

10 колабов сразу?)

это как? колаб насколько я знаю дает 11 гигабайт для видяхи

источник

11:25пожаловаться #6

EZ

Evgeniy Zheltonozhskiy🇮🇱 in AI / Big Data / Machine Learning

Alex Surname

я использовал хоровод для обучениях на несокльких видеокартах. по итогу получается аналог батч сайз. я сейчас немного другое ищу, мне памяти не хватает. возможно можно одной GPU считать используя память всех видях

Тебе нужен model parallelism?

источник

11:29пожаловаться #7

AS

Alex Surname in AI / Big Data / Machine Learning

мне не хватает памяти одной видяхи чтобы обучить модель. но при этом установлены еще 3 видяхи которые пустуют

источник

11:30пожаловаться #8

AS

Alex Surname in AI / Big Data / Machine Learning

при использовании Хоровод каждая из видях загружает в себя всю модель полностью

источник

11:31пожаловаться #9

AS

Alex Surname in AI / Big Data / Machine Learning

мне это не подходит, возможно есть апаратные или програмные средства чтоб как-то замапить память со всех видях в один кусок для одной ГПУ

источник

11:31пожаловаться #10

A

Alexei in AI / Big Data / Machine Learning

Alex Surname

мне это не подходит, возможно есть апаратные или програмные средства чтоб как-то замапить память со всех видях в один кусок для одной ГПУ

Стандартная библиотека нвидиа?

источник

11:35пожаловаться #11

AS

Alex Surname in AI / Big Data / Machine Learning

а подробнее?

источник

11:36пожаловаться #12

AS

Alex Surname in AI / Big Data / Machine Learning

я использую tensorflow

источник

11:36пожаловаться #13

p

palladdiumm in AI / Big Data / Machine Learning

Мне кажется, если замапить память всех видях в одно пространство, то можно получить разрыв шаблона, так как данные из областей памяти на разных видеокартах будут кочевать очень медленно

источник

11:52пожаловаться #14

EZ

Evgeniy Zheltonozhskiy🇮🇱 in AI / Big Data / Machine Learning

Alex Surname

мне не хватает памяти одной видяхи чтобы обучить модель. но при этом установлены еще 3 видяхи которые пустуют

Это называется model parallelism

источник

11:54пожаловаться #15

AS

Alex Surname in AI / Big Data / Machine Learning

palladdiumm

Мне кажется, если замапить память всех видях в одно пространство, то можно получить разрыв шаблона, так как данные из областей памяти на разных видеокартах будут кочевать очень медленно

ну есть же nvlink

источник

11:55пожаловаться #16

EZ

Evgeniy Zheltonozhskiy🇮🇱 in AI / Big Data / Machine Learning

Можешь посмотреть на gpipe например

источник

12:03пожаловаться #17

EZ

Evgeniy Zheltonozhskiy🇮🇱 in AI / Big Data / Machine Learning

Но в целом хорошей поддержки из коробки пока нет

источник