Size: a a a

Data science [ru]

2021 March 11
Data science [ru]
Алгоритмы машинного обучения и их типы

Термины «Машинное обучение» и «Искусственный интеллект» часто путают между собой. На самом деле, машинное обучение входит в область искусственного интеллекта. Ещё машинное обучение порой путают с прогнозной аналитикой (или предсказательным моделированием). И опять, машинное обучение может использоваться для предсказательного моделирования, но это всего лишь один из видов предиктивной аналитики, и его применение шире, чем предсказательное моделирование.
https://telegra.ph/Algoritmy-mashinnogo-obucheniya-i-ih-tipy-03-10
источник
Data science [ru]
Хорошие новости, друзья!

16 марта NewProLab  - ведущий провайдер курсов в сфере data science - запускает 12-недельный курс "Специалист по большим данным".

Эту программу уже прошли более 300 дата аналитиков и разработчиков, в их числе CDO ведущих компаний.  
👉🏻Успейте подать заявку: https://clck.ru/TayKh

Без преувеличения - это самая хардкорная и глубокая программа на рынке Big Data.  Вас ждет 36 практических занятий, 10 лаб, подготовка 2 собственных проектов и всё это на реальных дата-сетах и живых кейсах от команды преподавателей-практиков.

Вы научитесь строить модели машинного обучения, писать MapReduce-джобы, используя Hadoop Streaming и Python, готовить SQL-like запросы в Hive, работать с данными на HDFS, проводить анализ при помощи Apache Spark, а также строить алгоритмы рекомендательных систем.

P.S. Нужно подтянуть отдельный модуль? Программу можно пройти частями. Оставляйте заявку.
источник
2021 March 12
Data science [ru]
10 примеров, как искусственный интеллект может изменить ваш образ жизни
Искусственный интеллект в последнее время привлекает все больше внимания, и, если верить Биллу Гейтсу, из всех современных инноваций именно эта имеет наибольший потенциал изменить нашу жизнь сделать ее «более продуктивной, эффективной и вообще легкой».
https://telegra.ph/10-primerov-kak-iskusstvennyj-intellekt-mozhet-izmenit-vash-obraz-zhizni-03-11
источник
2021 March 13
Data science [ru]
Как «Яндекс» создавал «Алису»

Разработчики голосового ассистента — об особенностях российской аудитории, преимуществах перед конкурентами и перспективах технологии.
https://telegra.ph/Kak-YAndeks-sozdaval-Alisu-03-12
источник
Data science [ru]
3 апреля состоится Yandex.Taxi Data Driven

Это бесплатный митап для всех практикующих дата-аналитиков, сайентистов и просто разработчиков. В этом году он пройдет в онлайне по приглашениям.

С 11 утра до 5 вечера аналитики Яндекс Go будут делиться опытом на примере реальных кейсов, неудачами и успехами. После докладов будет секция воркшопов, где участникам предлагается вместе поштурмить над интересными и сложными проблемами бизнеса, продукта и аналитики.

На митапе можно получить не только актуальный опыт со всеми «граблями» на практике, но и влиться в комьюнити data-аналитики и проявить себя. И может даже попасть в Яндекс.

Регистрация с небольшим отборочным заданием, а это значит, что на встрече не будет «случайных» людей. Подробнее вот тут — https://taxi.yandex.ru/action/ytdd.
источник
2021 March 14
Data science [ru]
​​Топ 5 ресурсов для изучения математики для DataScience

1. KhanAcademy
[https://ru.khanacademy.org/]

2. Coursera
[https://www.coursera.org/]

3. StatQuest (Youtube)
[https://www.youtube.com/user/joshstarmer]

4. Introduction to Algebra
[https://www.khanacademy.org/math/algebra-home/alg-intro-to-algebra]
источник
2021 March 15
Data science [ru]
11 типов современных баз данных: краткие описания, схемы и примеры БД

Любые данные где-то хранятся. Будь это интернет вещей или пароли в *nix. Показываем схемы основных типов баз данных, чтобы наглядно представить различия между ними.

https://telegra.ph/11-tipov-sovremennyh-baz-dannyh-kratkie-opisaniya-shemy-i-primery-BD-03-14
источник
Data science [ru]
Обучаете нейронки и работаете с Big Data?
Тогда у Яндекса для вас есть DataSphere — новая облачная среда для ML-разработки и анализа данных

🔥Почему ее стоит попробовать:

⏳ Не нужно торопиться из-за временных ограничений, ноутбуки там никуда не пропадают.
💸 Стартовый грант на 3 000 ₽ каждому новому пользователю. Его хватит, например, на 50+ часов вычислений с GPU.
🧾 Когда грант закончится — Pay as you Go — платите только за вычисления.
🖥 Отлично знакомый многим из нас интерфейс Jupyter Notebook и документация на русском.
☁️ Бессерверные технологии, благодаря которым ML становится значительно дешевле всего, что было раньше.
✅ Есть NVIDIA V100 в конфигурациях с одной и четырьмя картами, и можно бесшовно переключаться c CPU на GPU без потери прогресса.

В DataSphere можно работать одному и в командах, использовать для работы, учебы и личных проектов!

👉Начните бесплатно по ссылке: https://clck.ru/TiZ6ghttps://clck.ru/TiZ6g

Любые вопросы задавайте ребятам в официальном чате DataSphere — продуктовая команда проекта оперативно там отвечает: https://t.me/yandex_datasphere
источник
2021 March 16
Data science [ru]
5 лучших библиотек машинного обучения

За последние несколько лет рост машинного обучения достиг стремительных темпов. Это связано с выпуском библиотек машинного обучения (МО)/глубокого обучения (ГО), которые абстрагируются от сложности скаффолдинга или реализации модели МО/ГО.https://telegra.ph/5-luchshih-bibliotek-mashinnogo-obucheniya-03-15
источник
2021 March 17
Data science [ru]
​​Диаграммы рассеяния

Диаграмма рассеяния лучше всего подходит для визуализации связи между двумя
спаренными множествами данных. Например,  показана связь между
числом друзей пользователя и числом минут, которые они проводят на веб-сайте
каждый день:
friends = [ 70, 65, 72, 63, 71, 64, 60, 64, 67)
minutes = [175, 170, 205, 120, 220, 130, 105, 145, 190)
labels = ['а', ·ь·, 'с', 'd', 'е', 'f'' 'g'' 'h', 'i']
# Друзья
# Минуты
# Метки
plt.scatter(friends, minutes)
# Назначить метку для каждой точки
for label, friend_count, minute_count in zip(labels, friends, minutes):
plt.annotate(label,
xy=(friend_count, minute_count), # Задать метку
xytext=(5, -5), # и немного сместить ее
textcoords='offset points')
plt.title("Чиcлo минут против числа друзей")
pl t. xlabel ( "Число друзей")
plt.ylabel("Чиcлo минут, проводимых на сайте ежедневно")
plt.show ()
источник
Data science [ru]
Интенсивный курс Deep Learning  от Newprolab для обучения работе с глубокими нейронными сетями на реальных датасетах в контексте боевых бизнес-задач.

🔥Старт 29 марта, задать вопросы и зарегистрироваться на программу можно тут: https://clck.ru/ThHAR

Что в программе?
Два блока: компьютерное зрение и Natural Language Processing. Научитесь предобрабатывать и классифицировать изображения, а также генерировать и классифицировать тексты с применением самых современных архитектур.

8 практических занятий, 2 проекта и туториал по разметке данных. Курс предназначен строго для дата сайентистов, ML-инженеров и менеджеров продукта, уже имеющих опыт машинного обучения. Обратная связь, живое общение, обмен опытом и рост в кругу коллег прилагается!

💡Специальная скидка 7% от цены на сайте по промокоду Devsp. Присоединяйтесь!
источник
2021 March 18
Data science [ru]
Построение графиков в Python при помощи Matplotlib
Картиной можно выразить тысячу слов. В случае с библиотекой Python matplotlib, к счастью, понадобится намного меньше слов в коде для создания качественных графиков.
https://telegra.ph/Postroenie-grafikov-v-Python-pri-pomoshchi-Matplotlib-03-17
источник
2021 March 19
Data science [ru]
Как устроены камеры с искусственным интеллектом

В каждой умной камере есть встроенная видеоаналитика, сегодня чаще всего здесь используются нейросети глубокого обучения или искусственный интеллект. Это стало возможным благодаря увеличению мощности процессоров видеокамер, раньше видеоаналитика могла существовать только на серверах.
https://telegra.ph/Kak-ustroeny-kamery-s-iskusstvennym-intellektom-03-18
источник
Data science [ru]
Разбираем, чем отличается версионирование в ML-разработке по коду от версионирования по коду и состоянию.

Ситуация:
вы работаете над проектом, например занимаетесь ML-прототипированием или анализом данных. По ходу работы в системе сохраняется код, и вы спокойно продолжаете, не боясь что-то упустить из виду. Но в конце недели понимаете, что где-то свернули не туда. Вы откатываетесь на несколько шагов назад по коду, и все бы ничего, но вычисления ведь придется делать заново. Это главный недостаток версионирования по коду.

Версионирование по коду и состоянию отличается тем, что во время работы сохраняется не только сам код, но и состояние вычислений. То есть состояние = код + вывод + переменные. Это значит, что если вы откатитесь назад, то получите не только прежний код, но и значения переменных. Вам не придется заново запускать вычисления, терять время и ресурсы.

Попробуйте версионирование по коду и состоянию в Yandex DataSphere, где каждому новому пользователю доступны бесплатные ресурсы на ML-разработку:

👉 https://clck.ru/ToJNp
источник
2021 March 20
Data science [ru]
Участие искусственного интеллекта в современном трейдинге

Профессиональные трейдеры периодически вынуждены модернизировать свои наработки, так как прогресс делает трейдинг сложнее. В 2000–2015 гг. им пришлось конкурировать с торговыми ботами, а потом научиться настраивать их, чтобы силы уравнялись. Примерно с 2015 года трейдерам и их ботам приходится конкурировать уже с искусственным интеллектом.
https://telegra.ph/Uchastie-iskusstvennogo-intellekta-v-sovremennom-trejdinge-03-19
источник
2021 March 21
Data science [ru]
5 лучших библиотек Python для визуализации данных
https://telegra.ph/5-luchshih-bibliotek-Python-dlya-vizualizacii-dannyh-03-20
источник
2021 March 22
Data science [ru]
Найти и обезвредить: как Big Data и Machine Learning сканируют ваши соцсети для предупреждения преступлений
https://telegra.ph/Najti-i-obezvredit-kak-Big-Data-i-Machine-Learning-skaniruyut-vashi-socseti-dlya-preduprezhdeniya-prestuplenij-03-21
источник
2021 March 23
Data science [ru]
Big Data: что это такое, как искать, хранить и использовать
В этой статье разберемся, что считается Big Data, а что нет, как эту информацию хранить, обрабатывать и получать пользу.
https://telegra.ph/Big-Data-chto-ehto-takoe-kak-iskat-hranit-i-ispolzovat-03-22
источник
2021 March 24
Data science [ru]
​​Описание одиночного набора данных
Факты - упрямая вещь, а статистика гораздо сговорчивее.
-Марк Твен

Благодаря полезному сочетанию живого слова и удачи социальная сеть DataSciencester
выросла до нескольких десятков пользователей, и директор по привлечению фи­
нансовых ресурсов просит вас проанализировать, сколько друзей есть у пользова­
телей сети, чтобы он мог включить эти данные в свои "презентации для лифта" 2•
Используя простые методы из главы 1, вы легко можете предъявить запрашивае­
мые данные. Однако сейчас вы столкнулись с задачей выполнения их описательно­
го аншlИза.
Любой набор данных очевидным образом характеризует сам себя:
# Число друзей
nurn friends
[100, 49, 41, 40, 25,
# ... и еще много других
]
Для достаточно малого набора данных такое описание может даже оказаться наи­
лучшим. Но для более крупного набора данных это будет выглядеть очень громоздко и, скорее всего, непрозрачно.
https://telegra.ph/Opisanie-odinochnogo-nabora-dannyh-03-23
источник
2021 March 25
Data science [ru]
🔥Большой гайд по библиотеке pandas: анализ данных на Python
https://telegra.ph/Vvedenie-v-pandas-analiz-dannyh-na-Python-03-24
источник