Size: a a a

ML Boot Camp Official

2020 April 11

ДС

Дмитрий Симаков in ML Boot Camp Official
В оптимизацию сетки, чтобы быстрее на цпу работало и больше уместилось?)
источник

SF

Sergei Fironov in ML Boot Camp Official
это да
источник

SF

Sergei Fironov in ML Boot Camp Official
ну и препроцессинг, мб
источник

SF

Sergei Fironov in ML Boot Camp Official
но без теста неочевидно
источник

ДС

Дмитрий Симаков in ML Boot Camp Official
Ну вот тут можно вспомнить ту библиотеку для сеток на цпу на плюсах. Но там только полносвязные слои.
источник

IT

Ivan Tyamgin in ML Boot Camp Official
Иван Брагин
Ну это уже детали, можно брать датасеты и под них уже код начинать писать, а во вторник уже понятно будет
А зачем тут код писать? Разве это не задача на возьми готовое решение, и можно что-то лучше придумать?
источник

SF

Sergei Fironov in ML Boot Camp Official
Ivan Tyamgin
А зачем тут код писать? Разве это не задача на возьми готовое решение, и можно что-то лучше придумать?
готовое по времени не пройдет скорее всего
источник

SF

Sergei Fironov in ML Boot Camp Official
смотря что ты имеешь в виду
источник

ИБ

Иван Брагин in ML Boot Camp Official
Ну взять готовое тоже время занимает. Я например с mt не работал
источник

ИБ

Иван Брагин in ML Boot Camp Official
Как раз за выходные разобраться
источник

BZ

Boris Zubarev in ML Boot Camp Official
Авторы предлагают первым использовать этот датасет:
• CCMatrix described in [Schwenk et al., 2019] — 13M web-crawled sentences. The raw corpus CCNet is available, but the filtering criteria which
is need to be applied to achieve CCMatrix are not yet released.


Готовые данные скачать нельзя (не нашел), можно повторить эксперимент авторов
Given the CPU required to run the full pipeline on such a big corpus we share a mapping from url to the information we computed. You can reconstruct the corpus used in the paper by using:


Но в статье пишут:
The total processing time is about 9 hours using 5000 CPU cores for one snapshot.

Ну и занимает 10 тб, пруф: https://github.com/facebookresearch/cc_net/issues/7#issuecomment-605461660

Это какой-то прикол или просто я дурак и не понял как легко добыть эти 13 миллионов?
Кому-то, включая авторов, удалось добыть?
источник

SS

Sergey Star in ML Boot Camp Official
Иван Брагин
Вообще то можно начинать участвовать, задание уже выдано
Еще бы с призовыми бы ясность навести)
источник
2020 April 12

A

AntiBot in ML Boot Camp Official
Confirm that you are not a robot.
источник

D

Dasha in ML Boot Camp Official
Кто-нибудь читал Дага Хеллмана "Стандартная библиотека Python 3"? Обещают в синопсисе "решение сложных математических задач", найти бы фрагмент - стоит оно того или нет
И все рекомендуют Марка Лутца, но, кажется, у него совсем базовый справочник.
Лучше ли в этом смысле книга мистера Хеллмана?
источник
2020 April 13

GF

Gordon Frohman in ML Boot Camp Official
При чём здесь питон со стандартной библиотекой и математические задачи?
источник

NB

Nikolai Bragin in ML Boot Camp Official
Dasha
Кто-нибудь читал Дага Хеллмана "Стандартная библиотека Python 3"? Обещают в синопсисе "решение сложных математических задач", найти бы фрагмент - стоит оно того или нет
И все рекомендуют Марка Лутца, но, кажется, у него совсем базовый справочник.
Лучше ли в этом смысле книга мистера Хеллмана?
скачай и наслаждайся.
источник

NB

Nikolai Bragin in ML Boot Camp Official
источник

NB

Nikolai Bragin in ML Boot Camp Official
Ачивка "Помоги Даше найти..." разблокирована.
источник

D

Dasha in ML Boot Camp Official
Nikolai Bragin
Ачивка "Помоги Даше найти..." разблокирована.
🙂
🤝
источник

IV

Ivan Veriga in ML Boot Camp Official
Кстати, все зеркала либгена обращаются к одной базе?
источник