Size: a a a

2019 September 03

VD

Victor Dymov in Science FYI
а не " вот тебе код, разбросай по ядрам" )
источник

AZ

Arthur Zalevsky in Science FYI
Victor Dymov
если будет интерес расскажу, много делал под это дело, вплоть до маллока внутри кернела гпу )
хм, посмотрел сейчас api tensorflow. мб для начала попробую его) у меня как раз есть проект в работе где много вращений матриц, а у него прям чуть ли не dropin замены для моего кода нашлись.
источник

AZ

Arthur Zalevsky in Science FYI
но, конечно, надо тестить
источник

VD

Victor Dymov in Science FYI
Arthur Zalevsky
хм, посмотрел сейчас api tensorflow. мб для начала попробую его) у меня как раз есть проект в работе где много вращений матриц, а у него прям чуть ли не dropin замены для моего кода нашлись.
не использую тензорфлоу, пишу сам, но вам с матрицами скорее всего в самый раз
источник

VD

Victor Dymov in Science FYI
про матрицы и линал, гляньте еще BLAS
источник

VD

Victor Dymov in Science FYI
может оно и еще лучше будет
источник

O

Orodret in Science FYI
Victor Dymov
не впечатляющее достижение с моей точки зрения, так как цимес параллелизма в возможности тонкой декомпозиции задачи )
С точки зрения человека, который специализируется на написании прог для параллельных вычислений, вполне возможно не печатляет)) В го идея в том, чтобы сделать это удобным и по сути свести к асинхронным вызовам.
источник

AZ

Arthur Zalevsky in Science FYI
Victor Dymov
не использую тензорфлоу, пишу сам, но вам с матрицами скорее всего в самый раз
ну оптимизации - это хорошо. но, будем откровенны, на них рехнуться можно. ведь даже SMP не такой уж и Symmetric с точки зрения доступа к памяти)  если же речь еще и про MPI, то, в идеале, надо учитывать архитектуру кластера для минимизации траффика. если еще есть IO, то в случае с тем же hdf5 можно подбирать размер шардов, сжатие и тд. а ведь еще уровень ниже. Например на уровне юзерспейса та же Lustre дает возможность оптимизировать IO за счет управления страйпингом.

так что оптимизировать нужно конкретную задачу под конкретный сетап) и то, если человекочасы на оптимизацию окупают сокращение человеко или компьютеро часов на продакшн работу)
источник

VD

Victor Dymov in Science FYI
Arthur Zalevsky
ну оптимизации - это хорошо. но, будем откровенны, на них рехнуться можно. ведь даже SMP не такой уж и Symmetric с точки зрения доступа к памяти)  если же речь еще и про MPI, то, в идеале, надо учитывать архитектуру кластера для минимизации траффика. если еще есть IO, то в случае с тем же hdf5 можно подбирать размер шардов, сжатие и тд. а ведь еще уровень ниже. Например на уровне юзерспейса та же Lustre дает возможность оптимизировать IO за счет управления страйпингом.

так что оптимизировать нужно конкретную задачу под конкретный сетап) и то, если человекочасы на оптимизацию окупают сокращение человеко или компьютеро часов на продакшн работу)
ну, в общем, вопрос не только в стоимости человекочасов, сколько во времени, например, вам валятся данные с сети метеодатчиков, коих много и хочется каждый день иметь уточнение прогноза (то есть перестроение модели), а если модель престраивается больше трети суток, то как бы уже и не надо )
источник

AZ

Arthur Zalevsky in Science FYI
ну для такой воспроизводимой задачи (да еще, наверное, и под конкретное железо) - безусловно) наука же, обычно, один раз запустил и ок)
источник

VD

Victor Dymov in Science FYI
Arthur Zalevsky
ну для такой воспроизводимой задачи (да еще, наверное, и под конкретное железо) - безусловно) наука же, обычно, один раз запустил и ок)
ну не знаю, эту систему я как раз для знакомого океанолога кодил под его кандидатскую
источник

VD

Victor Dymov in Science FYI
наука не сводится только к построению поков )
источник

BK

Bogdan Kirillov in Science FYI
Arthur Zalevsky
хм, посмотрел сейчас api tensorflow. мб для начала попробую его) у меня как раз есть проект в работе где много вращений матриц, а у него прям чуть ли не dropin замены для моего кода нашлись.
Пайторч попробуй, работает как нампай. Не придется няшится с особенностями тензорфлоу (там хоть eager execution давно сделали, но все ещё такое себе)
источник

AZ

Arthur Zalevsky in Science FYI
Bogdan Kirillov
Пайторч попробуй, работает как нампай. Не придется няшится с особенностями тензорфлоу (там хоть eager execution давно сделали, но все ещё такое себе)
ну, в pytorch  я нужных функций не нагуглил. а в тензорфлоу прям чуть ли не dropin ) но за совет спасибо)
источник

BK

Bogdan Kirillov in Science FYI
Arthur Zalevsky
ну, в pytorch  я нужных функций не нагуглил. а в тензорфлоу прям чуть ли не dropin ) но за совет спасибо)
А что за функции?
источник

AZ

Arthur Zalevsky in Science FYI
Bogdan Kirillov
А что за функции?
на самом деле мне нужна: https://docs.scipy.org/doc/scipy/reference/generated/scipy.ndimage.rotate.html

но ее можно сделать element-wise  что-то в духе https://www.tensorflow.org/graphics/api_docs/python/tfg/geometry/transformation/rotation_matrix_3d  (но на cpu аналогичное поэлементное вращение было в несколько раз медленнее bulk).

хотя вот сейчас нагуглил еще так: https://docs-cupy.chainer.org/en/stable/reference/generated/cupyx.scipy.ndimage.rotate.html обещают, что :
> A NumPy-compatible matrix library accelerated by CUDA
источник

BK

Bogdan Kirillov in Science FYI
Arthur Zalevsky
на самом деле мне нужна: https://docs.scipy.org/doc/scipy/reference/generated/scipy.ndimage.rotate.html

но ее можно сделать element-wise  что-то в духе https://www.tensorflow.org/graphics/api_docs/python/tfg/geometry/transformation/rotation_matrix_3d  (но на cpu аналогичное поэлементное вращение было в несколько раз медленнее bulk).

хотя вот сейчас нагуглил еще так: https://docs-cupy.chainer.org/en/stable/reference/generated/cupyx.scipy.ndimage.rotate.html обещают, что :
> A NumPy-compatible matrix library accelerated by CUDA
источник

AZ

Arthur Zalevsky in Science FYI
это 2д. такого хватает везде. а мне нужно именно  3д
источник

AZ

Arthur Zalevsky in Science FYI
@apredeus @abeliavskaia  о, вы тоже поддались этому поветрию и выпилились из фб?
источник

O

Orodret in Science FYI
Arthur Zalevsky
@apredeus @abeliavskaia  о, вы тоже поддались этому поветрию и выпилились из фб?
А есть такое поветрие? Оо
источник