Size: a a a

Data science [ru]

2020 May 09
Data science [ru]
​​Mapillary опубликовали датасет для распознавания мест

Mapillary Street-level Sequences Dataset (MSLS) — это самый крупный датасет с изображениями для предсказания мест. Датасет содержит 1.6 миллионов изображений, для каждого из которых доступны метаданные местности. Изображения мест снимали с ракурса автомобиля на дороге. Данные покрывают места из 30 городов на 6 континентах, разные погодные условия, освещение, типы движущихся объектов и типы камер. Сбором и тестированием датасета занимались исследователи из Mapillary.
Читать#
источник
Data science [ru]
​​NetApp приобрела Cloud Jumper, лидера рынка в области инфраструктуры виртуальных десктопов

Компания NetApp (NASDAQ: NTAP), лидер рынка в области управления данными в облаках, объявила о приобретении компании Cloud Jumper, разработчика облачного ПО и лидера в областях инфраструктуры виртуальных десктопов (VDI) и служб удаленных десктопов (RDS). В результате сделки, NetApp Virtual Desktop Services сможет решать самые сложные задачи, связанные с виртуальными десктопами и управлением приложениями, что позволит заказчикам разворачивать, управлять, отслеживать и оптимизировать эти среды с помощью комплексного решения от одной компании в удобном для них облаке.
Читать#
источник
2020 May 10
Data science [ru]
​​6 навыков программирования, которые стоит освоить взрослым и детям

Научиться создавать чат-боты в соцсетях, формировать отчеты одним нажатием кнопки и даже программировать роботов вовсе не сложно. Для этого достаточно найти пару часов в своем графике и отправиться на курсы по программированию.
Читать#
источник
Data science [ru]
​​Какое влияние машинное обучение оказывает на ваш бизнес

В Gartner включили машинное обучение в число главных приоритетов. Не стоит ждать, что внедрение средств машинного обучения позволит заменить всех сотрудников компьютерами или удвоить доходы, однако они в состоянии обеспечить компании конкурентные преимущества.
Читать#
источник
2020 May 11
Data science [ru]
​​10 Data Science книг к прочтению в 2020 году

Эти книг позволяют изучить науку о данных (Data Science) и применить полученные знания на практике. Они написана так, что способствует погружению в Data Science аналитику, фактически не обладающего глубокими знаниями в этой прикладной дисциплине.
В объемах, достаточных для начала работы в области Data Science, книги содержат интенсивный курс языка Python, элементы линейной алгебры, математической статистики, теории вероятностей, методов сбора, очистки, нормализации и обработки данных. Даны основы машинного обучения.
Читать#
источник
Data science [ru]
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И МАШИННОЕ ОБУЧЕНИЕ
Искусственный интеллект, машинное обучение и глубокое обучение… Чем они отличаются? Для более лучшего понимания, эти понятия можно разложить так. Компьютер тем или иным образом имитирует поведение человека. Машинное обучение (ML, Machine Learning) — это подмножество ИИ, состоящее из методов, которые позволяют компьютерам делать выводы на основе данных и предоставлять ИИ-приложениям. Глубокое обучение (DL, Deep Learning) является подмножеством машинного обучения, и оно дает компьютерам возможность решать более сложные задачи.
источник
2020 May 12
Data science [ru]
​​Исследователи пытаются замаскировать внутреннюю структуру нейросетей для защиты от атак по энергопотреблению
Инженеры из Университета штата Северная Каролина анонсировали способ защиты нейронных сетей от дифференциальной атаки по энергопотреблению. Свою работу они представят на Международном симпозиуме IEEE 2020.
источник
Data science [ru]
Зачем большие данные в автомобилестроение?
Современный автомобиль — накопитель информации: он аккумулирует все данные о водителе, окружающей среде, подключенных устройствах и о себе самом. Уже скоро одно транспортное средство, которое подключено к сети наподобие той, что объединяет электромобили Tesla Model S, будет генерировать до 25 Гб данных за час.
источник
2020 May 13
Data science [ru]
​​@yegor256news - авторский англоязычный канал Егора Бугаенко, программиста, блоггера, автора Elegant Objects, создателя платформы Zerocracy и частого спикера на многих крупных IT-конференциях; подписывайтесь и следите за его творчеством!
источник
Data science [ru]
Возможности Deep Learning

Deep Learning занимает важнейшую роль в обществе в различных сферах деятельности и стоит в основе практически всех главных вычислительных прорывов последних нескольких лет. Сегодня сила Deep Learning помогает компьютерам превзойти способности человека.
Читать#
источник
2020 May 14
Data science [ru]
Почему всякому Data Scientist нужен свой Data Engineer
Data Scientist признали «самой сексуальной работой в XXI веке». The Harvard Business Review считает, что этот «гибрид дэйта-хакера, аналитика, переговорщика и доверенного советника» — редкое сочетание навыков, заслуживающих высокой зарплаты.
Слишком хорошо, чтобы быть правдой? Да, по словам Форбса. Оказывается, ученые-данные тратят большую часть своего времени (до 79%!) на работу, которую они больше всего ненавидят.
источник
Data science [ru]
​​IDC: Половина сервисов IaaS и PaaS используется для разработки приложений, управления и анализа данными

Ключевые деловые приложения, включая CRM, ERM и SCM, в облачном варианте чаще всего приобретаются в виде SaaS-сервисов.
Более половины закупок инфраструктурных и платформенных сервисов (IaaS и PaaS) в публичных облачных средах приходится на три задачи: управление данными, разработка и тестирование приложений и анализ данных. Хотя на рабочие нагрузки, связанные с важнейшими бизнес-приложениями (CRM, ERM и SCM) идет больше средств, они приобретаются в виде программ, предоставляемых в виде сервиса (SaaS), а большинство нагрузок потокового вещания работает в виде цифровых сервисов на облачной инфраструктуре. В то же время в IDC не считают показательной долю рабочих нагрузок в виде веб-серверов, поскольку подавляющее большинство веб-серверов в облаке работает в качестве компонентов других бизнес-приложений.
Управление данными и их анализ в ближайшее время останутся наиболее распространенными рабочими нагрузками в публичных облачных системах. Это объясняется переносом в облако унаследованных программных систем, доступностью облачных машин с ускорителями вычислений и распространением сервисов с функциями искусственного интеллекта и машинного обучения. Распространение методов разработки и тестирования приложений в облаке и создания исходно рассчитанных на работу в облаке приложений тоже поддержит рост соответствующего сегмента.
источник
2020 May 15
Data science [ru]
​​Cоветы ИТ-специалистам

Даже будучи профессионалом своего дела, повышать свою ценность на рынке труда необходимо для достижения наилучших результатов. Так и для ИТ-специалистов: помимо основного требования - знать свои обязанности и грамотно их выполнять, существует еще ряд полезных привычек, необходимых для успешной работы.
Читать#
источник
Data science [ru]
​​Пандемия стала катализатором революционных изменений в ИТ-индустрии

Как защитить свою ИТ-инфраструктуру для удаленной работы? Как сделать бизнес более устойчивым к глобальным потрясениям? Какие проблемы решают облачные технологии? Какие ИТ-задачи следует автоматизировать? Как использовать искусственный интеллект (ИИ), чтобы справиться с массовым увеличением вызовов?
Далее...
источник
2020 May 16
Data science [ru]
Нейросеть научили создавать несуществующие слова и давать им определения

Томас Димсон, программист, создавший приложение Hyperlapse для Instagram, представил свой новый проект под названием This Word Does Not Exist. Проект представляет собой нейросеть, которая придумывает несуществующие слова и даёт им определения.
источник
Data science [ru]
​​Глубокое обучение

Люди, велосипеды, автомобили или дорога, небо, трава. Пиксели изображения представляют отдельные лица или объекты на переднем плане перед автомобилем с управлением ИИ, а какие пиксели представляют классы фона? Эта задача, известная как паноптическая сегментация, является фундаментальной проблемой, которая находит применение во многих областях, таких как автомобили с автоматическим управлением, робототехника, дополненная реальность и даже в анализе биомедицинских изображений. На факультете компьютерных наук Фрайбургского университета доктор Абхинав Валада, доцент кафедры обучения робототехнике и член BrainLinks-BrainTools, занимается этим вопросом исследования. Валада и его команда разработали современную модель искусственного интеллекта (ИИ) "EfficientPS", которая обеспечивает более быстрое и эффективное последовательное распознавание визуальных сцен.
источник
2020 May 17
Data science [ru]
​​Модель машинного обучения предсказывает смертность пациентов с COVID-19

Инструменты машинного обучения выбрали три биомаркера - уровни молочной дегидрогеназы, лимфоцита и высокочувствительного С-реактивного белка - которые могут предсказать смертность пациентов с COVID-19 из образцов крови 485 инфицированных людей в Ухане, Китай, согласно статье, опубликованной в Nature Machine Intelligence. Эти инструменты предсказывали смертность отдельных пациентов более чем за десять дней до их результатов с точностью более 90%.
источник
Data science [ru]
​​ИИ разработал более справедливую налоговую систему. Нейросеть, созданная компанией Salesforce, занимается тестированием и разработкой идеальной налоговой системы в моделируемой среде.
ИИ получил название AI Economist, в его основе лежит система обучения с подкреплением: она предполагает применение вознаграждения и наказания к машинным алгоритмам с целью максимизации желаемых результатов. По тому же принципу, например, созданы алгоритмы Google DeepMind AlphaGo и AlphaZero.
Цель эксперимента — помочь правительствам во всем мире создать более справедливую систему налогообложения, говорится в сообщении компании.
«Экономическое неравенство усиливается во всем мире и вызывает растущую обеспокоенность в связи с его негативным влиянием на экономические возможности, здоровье и социальное обеспечение. Налоги являются важным инструментом правительства для сокращения неравенства. Однако поиск налоговой политики, которая оптимизирует равенство и производительность, является нерешенной проблемой. С помощью AI Economist мы хотим выяснить, как новые налоговые системы могут уменьшить неравенство, повысить производительность и в конечном итоге сделать мир лучше» Ричард Сошер, Salesforce.
Исследователи отмечают, что такой подход позволит выявить нерациональное поведение, которое экономисты часто не учитывают в своих моделях. По их словам, ИИ уже предложил сценарии, которые на 16% эффективнее существующих.
источник
2020 May 18
Data science [ru]
Главное отличие дата-центров от других зданий — промышленных или офисных — состоит в том, что они работают круглый год, без остановки даже на одну-две минуты. А значит — нон-стоп потребляют энергию. По данным британского научного журнала Nature, на все центры обработки данных в мире уходит около 200 ТВт·ч электроэнергии в год. Это больше, чем национальное энергопотребление некоторых не самых маленьких стран и примерно половина электричества, которое используется для транспорта во всем мире. И, конечно, далеко не всегда эта энергия производится из чистых источников: например, Китай занимает второе место по объему рынка ЦОД, но около 73% электроэнергии для них в стране получают из угля и только 23% — из возобновляемых источников энергии
источник
Data science [ru]
​​Новый ИИ генерирует голос за 500 миллисекунд.

Социальная сеть Facebook представила высокоэффективную систему на основе ИИ, которая быстро преобразовывает текст в речь. Ее можно использовать в режиме реального времени и с использованием обычных процессоров. Исследователи рассказали о новом подходе для сбора данных — он позволил производить секунду звука за 500 миллисекунд.
Система Facebook сможет производить высококачественные голоса без необходимости использования специализированного оборудования. Специалисты компании отмечают, что система достигла 160-кратного ускорения по сравнению с аналогами. Это сделает его пригодным даже для устройств с ограниченными вычислительными возможностями.
Система Facebook состоит из четырех частей, каждая из которых фокусируется на различных аспектах речи: лингвистической, особенностях произношения, акустической модели и нейронной кодировке голоса.
ИИ преобразовывает текст в последовательность лингвистических цепочек — предложения и единицы звука, которые отличаются друг от друга в зависимости от того, в каком слове они используется. Модель также отвечает за особенности происхождения и стиль — ИИ может интерпретировать и прогнозировать ритмы речи, предложения и частоты.
Встраивание стилей позволяет системе создавать новые голоса — «мягкие», «быстрые», «формальные», при этом для их изменений требуется лишь небольшое количество данных. Для каждого стиля требуется всего 30 до 60 минут, утверждает Facebook — на порядок меньше, чем несколько часов записей, которые нужны для аналогичной системы Amazon.
источник