Size: a a a

Data science [ru]

2020 July 15
Data science [ru]
В России создали новую систему цифрового мониторинга
С помощью новой системы цифрового мониторинга безопасности можно будет оперативно обнаружить аномалии на производстве.
Когда подавляющее большинство традиционных производственных процессов уже основано на искусственном интеллекте, машинном обучении, анализе больших данных и системных командах на основе этого анализа, вопросы цифровой безопасности становятся определяющими. Важно не просто определить аномалию, которая может повлиять как на конкретный производственный цикл, так и на систему в целом, но и сделать это максимально оперативно: с помощью цифровых настроек или ручного вмешательства исправить «помарку» или устранить угрозу в системе.
источник
Data science [ru]
Новая модель искусственного интеллекта (ИИ) определяет жесты с точностью до 85%. Для ее создания ученые изучили то, как работает мозг человека.
Исследователи из Наньянгского и Сиднейского технологических университетов разработали систему машинного обучения, которая может распознавать жесты рук. Для этого она анализирует изображения с помощью растягивающихся тензометрических датчиков. Архитектура искусственного интеллекта (ИИ) описана в журнале Nature Electronics, ученые вдохновились устройством мозга человека.
источник
2020 July 16
Data science [ru]
Объект среза как объект или встроенный метод slice
В Python списки по реализации похожи на векторы. А векторы это динамические массивы, то есть последовательности элементов. К этим элементам можно обращаться - получить первый, второй, пятый, десятый элемент. Положение в массиве - это индекс.
Но когда надо получить элементы с 1 по 3, или четные, или каждый третий - то одними индексами не обойтись. Поэтому в Python есть понятие - СРЕЗы.
источник
Data science [ru]
Google представила первый переводчик, который умеет работать с иероглифами. Инструмент обучается и работает лучше с каждым переводом.
Компания Google запустила переводчик иероглифов, использующий машинное обучение для расшифровки древнеегипетского языка. Эту функцию добавили в приложение Arts & Culture. Она также позволяет пользователям переводить свои слова и эмодзи в иероглифы. В Google отметили, что это первый инструмент, который с помощью машинного обучения умеет переводить и интерпретировать иероглифы. Он становится лучше по мере популярности среди пользователей.
источник
2020 July 17
Data science [ru]
Россия стала лидером в сфере технологий и анализа данных

Согласно исследованию Global Skill Index проекта Coursera, Россия стала лидером в сфере технологий и анализа данных. Страна по этому показателю опережает США и Китай.
Из исследования образовательной платформы Coursera стало известно, что Россия признана самой высококвалифицированной страной в сфере технологий и анализа данных. Страна лидирует в области разработки программного обеспечения, статистического программирования, управления данными и операционными системами. Компетенции России в области технологий и анализа данных определяются исследованием как «передовые и конкурентоспособные».
источник
Data science [ru]
Аналитика данных: правильный подход

По мере своего развития аналитика данных становится все более востребованной. Опрошенные порталом InformationWeek эксперты рассказывают о том, каким образом нужно выстроить процессы, чтобы ваша организация могла применять эту критически важную технологию в бизнесе.
За последние несколько лет предприятия всех типов и размеров превратились в организации, управляемые данными, и теперь при помощи аналитики можно проанализировать клиентские и рыночные данные и практически мгновенно извлечь из них полезную информацию. Несмотря на то, что о ее преимуществах хорошо известно, некоторые организации настойчиво игнорируют ее, поскольку опасаются, что дорогостоящие запуск и поддержка аналитического проекта не принесут им потенциальной выгоды. В то же время технология анализа данных постоянно совершенствуется и становится более доступной, поэтому не исключено, что такие организации могут пересмотреть свое отношение к ней.
источник
2020 July 18
Data science [ru]
слайсы/срезы
Синтаксис Python легкий, читаемый. Хочется упомянуть массивы (как структура с последовательными элементами). В Python они бывают разные - listtuple, строки Операции с массивами:
источник
Data science [ru]
Gartner: 10 основных тенденций в области данных и аналитики
https://www.gartner.com/en
Выявленные Gartner тенденции, возможно, позволят компаниям использовать данные и аналитику, чтобы успешно преодолеть финансовые и операционные трудности, вызванные COVID-19.
«Чтобы проложить новый путь в мир после COVID-19, руководителям подразделений данных и аналитики требуются непрерывно нарастающие в смысле быстроты обработки и доступа скорость и масштабы анализа, чтобы добиться успеха в условиях беспрецедентных рыночных сдвигов», — считает заслуженный вице-президент Gartner по исследованиям Рита Саллем.
Речь идет о следующих тенденциях.
источник
2020 July 19
Data science [ru]
ПЕРЕСТАНОВКА И КОМБИНАЦИЯ В PYTHON
Python предоставляет прямые методы для поиска перестановок и комбинаций последовательности. Эти методы присутствуют в пакете itertools.
источник
Data science [ru]
Евросоюз начинает антимонопольное расследование о работе голосовых помощников, например, в Siri от Apple и Alexa от Amazon. Всего под дела попадают 400 компаний по всему миру. Регуляторы проверят, как ИТ-компании применяют пользовательские данные, собираемые голосовыми ассистентами, сообщает комиссар по вопросам конкуренции Маргрет Вестагер.
источник
2020 July 20
Data science [ru]
Полезные библиотеки: RPC и nameko
Всем привычно, когда управление и данные внутри программы перемещаются на одной машине. Все хорошо и ясно (в какой-то мере), но что делать если данных становится много и возникает желание распределить вычисления?
Берем 2 компьютера, а дальше... А дальше нам надо как-то из программы на одном компьютере запустить метод на другом, да еще и данные перекинуть. Вот здесь на помощь и приходит RPC (Remote Procedure Call) вызов удалённых процедур.
источник
Data science [ru]
Новый инструмент IBM шифрует данные, пока устройства используются
Новый инструмент IBM шифрует данные, пока устройства используются. Он особенно подойдет для таких сфер, как финансы и здравоохранение.
IBM опубликовала набор инструментов, который упрощает гомоморфное шифрование (FHE) в приложениях для iOS и MacOS. Так хакеры не смогут разобраться в некоторых видах конфиденциальной информации, которую обычно необходимо расшифровать. Среди них могут быть финансовые или медицинские данные. Приложения также могут выборочно расшифровывать содержимое, поэтому пользователь может получить только те данные, которые он должен видеть.
Инструмент уже доступен на GitHub (iOS, macOS), а версии для Android и Linux появятся через «несколько недель». IBM предупредила, что эта версия «не идеальна и не окончательна», и что они не будут полезны для всех случаев. Однако они нужны в тех случаях, когда даже временная расшифровка может представлять риск для безопасности.
источник
2020 July 21
Data science [ru]
Ученые из США представили чип, который может обеспечить большую вычислительную мощность для обучения ИИ.
Пока он стоит несколько миллионов долларов, но в будущем станет дешевле и позволит независимым командам заниматься сложным обучением моделей.
источник
Data science [ru]
Полезные библиотеки: freezegun - замораживаем время
В модуле datetime есть now() - метод, который возвращает текущее время. Применяется метод часто, например, создаем новую запись в базе данных - в лог пишем запись от текущего времени.
Вот только такой код оттестировать не всегда просто - иногда надо чтобы now() возвращал конкретное время. Для этого случая есть freezegun:
источник
2020 July 22
Data science [ru]
Полезные инструменты: Chrome Logger

Ох, далеко не весь код "красив". Бывает такая лапша, что без бутылки не разобраться. Вот только вместо бутылки обычно используют отладчики, логгирование и прокручивание всего алгоритма/состояний в голове.
В веб проектах логгирование, а точнее говорят "отладка принтами" - популярный метод.
источник
Data science [ru]
Google создала новый бесплатный курс по Kotlin-разработке для новичков
Google запустила ещё один онлайн-курс для желающих научиться разрабатывать Android-приложения на Kotlin.
Бесплатный курс Android Basics in Kotlin рассчитан на тех, у кого нет абсолютно никакого опыта в программировании. Именно Kotlin компания называет главным языком разработки софта для своей мобильной платформы. Этот язык, по словам Google, уже используется 60% профессиональных Android-разработчиков, на нём написано 70% из первой тысячи самых популярных приложений Play Store.
Курс состоит из 5 модулей. Он включает пошаговые инструкции о том, как строить приложения в Android Studio и запускать их на устройствах, тесты для проверки полученных знаний в конце каждого модуля, а также практическую часть, которая предусматривает создание нескольких Android-проектов.
Пока доступен только 1 модуль, в дальнейшем компания обещает выложить остальные.
источник
2020 July 23
Data science [ru]
enum, перечисления
Программист время от времени сталкивается с необходимостью ограничить множество допустимых значений для некоторого типа данных. Например, день недели это 7 различных значений, а месяцев у нас 12. Для удобного хранения подобных данных придуманы перечисления - enum.
Стандартная реализация enum появилась в Python начиная с версии 3.4 ( PEP 435. До этого ее легко заменяли словарями.
Реализация представлена модулем enum. Модуль содержит несколько классы EnumIntEnum (константы могут иметь только тип int) и декоратор unique, который проверяет ваш набор констант на дубликаты.
источник
Data science [ru]
Исследователи из США представили новый метод обучения ИИ, который ускорит процесс в 2-3 раза. В будущем такие процессоры могут использовать в сетях 5G.
Исследователи добились прорыва в обучении искусственного интеллекта (ИИ), используя свет вместо электричества. Новый метод значительно повышает как скорость, так и эффективность работы нейронных сетей — формы ИИ, целью которой является воспроизведение функций, выполняемых человеческим мозгом. Так машина обучает себя определенной задаче, не наблюдая за тем, как с этим справляется человек.
Нынешние методы машинного обучения ограничены в выполнении сложных операций — для них нужна огромная мощность. При этом чем сложнее задача, тем больше данных и, следовательно, энергопотребление. Такие сети также ограничены медленной передачей данных в устройствах.
Исследователи из Университета Джорджа Вашингтона в США обнаружили, что использование фотонов в нейронных процессорах поможет преодолеть эти ограничения и создать более мощный и энергоэффективный ИИ.
источник
2020 July 24
Data science [ru]
yield from
Рассмотрим еще одну страшную конструкцию в Python:  yield from
Напомню, генератор это объект который можно про итерировать только однажды. Записывается как:
источник
Data science [ru]
источник