Size: a a a

Data science [ru]

2020 September 20
Data science [ru]
​​Рынок сервисов машинного обучения и искусственного интеллекта для интернета вещей за шесть лет вырастет на порядок
Ценность данных растет, и эта ценность стимулирует рынок расширенной аналитики для интернета вещей (IoT), следствием чего стало появление доступных и готовых к использованию решений для машинного обучения и искусственного интеллекта. Поставщики упрощают доступ к инструментам машинного обучения и искусственного интеллекта за счет новых вариантов развертывания, которые включают не только периферийный, локальный и облачный варианты, но также варианты «платформа как сервис» (PaaS) и «программное обеспечение как сервис» (SaaS). Такое наблюдение сделали специалисты консалтинговой компании ABI Research, которые прогнозируют, что рынок сервисов машинного обучения и искусственного интеллекта для интернета вещей увеличится с 1,09 млрд долларов в 2020 году до 10,6 млрд долларов в 2026 году.
Периферийный или краевой вариант (в противовес облачному) больше распространен в производственном и промышленном сегментах, где существует неотложная потребность в оценке, преобразовании и дополнении данных по мере их создания. В то же время, системы машинного обучения и искусственного интеллекта позволяют выполнять расширенную аналитику в облаке, опираясь на предварительно обработанные и организованные наборы данных.
К лидерам направления эксперты относят компании Amazon Web Services (AWS), Azure, Google, SAS и C3.ai, которые предлагают поддержку как собственных, так и сторонних инструментальных средств.
источник
Data science [ru]
Модуль json
#Python

JSON (JavaScript Object Notation) - простой формат обмена данными, основанный на подмножестве синтаксиса JavaScript. Модуль json позволяет кодировать и декодировать данные в удобном формате.
Кодирование основных объектов Python:
источник
2020 September 21
Data science [ru]
Скала | Циклы (в то время как, в то время как для вложенных циклов)
#Scala

Циклы в языках программирования — это функция, которая облегчает многократное выполнение набора инструкций / функций, в то время как некоторые условия оцениваются как истинные. Циклы упрощают задачу программистов. Scala предоставляет различные типы циклов для обработки ситуации на основе условий в программе. Петли в Scala:
источник
Data science [ru]
Архитектура HBase
#Hadoop

Архитектура HBase имеет 3 основных компонента: HMaster, Region Server, Zookeeper.
источник
2020 September 22
Data science [ru]
Котлин когда выражение
#Kotlin

В Kotlin, когда заменяет оператор переключения других языков, таких как Java. Определенный блок кода должен выполняться, когда выполняется какое-то условие. Аргумент выражения when сравнивает все ветви одну за другой, пока не будет найдено какое-либо совпадение. После первого найденного совпадения он достигает конца блока when и выполняет код рядом с блоком when. В отличие от регистра переключателя в Java или любом другом языке программирования, нам не требуется оператор break в конце каждого сценария.
источник
Data science [ru]
Модуль os
#Python 

Модуль os предоставляет множество функций для работы с операционной системой, причём их поведение, как правило, не зависит от ОС, поэтому программы остаются переносимыми. Здесь будут приведены наиболее часто используемые из них.
Будьте внимательны: некоторые функции из этого модуля поддерживаются не всеми ОС.
источник
2020 September 23
Data science [ru]
Функции Variadic в Go
#GO

Функция, которая вызывается с переменным числом аргументов, называется переменной функцией. Или, другими словами, пользователю разрешено передавать ноль или более аргументов в функции переменной. fmt.Printf — это пример функции с переменным числом аргументов: для нее требуется один фиксированный аргумент при запуске, после чего он может принимать любое количество аргументов.
источник
Data science [ru]
Количество вакансий для специалистов в Data Science выросло в разы. Начни осваивать перспективную профессию уже сейчас. Быстрый старт ждёт тебя на бесплатном онлайн-интенсиве.

Регистрируйся: 🔜 https://clc.am/Yrnb3A

Что будет на занятиях?
➕ Знакомство с основами Python.
➕ Работа с библиотеками Matplotlib и Pandas.
➕ Проработка техник исследования данных.
➕ Изучение статистических методов на Python.
➕ Построение моделей для реальных кейсов.

🎁 Авторы трёх лучших проектов получат сертификаты на 30 000 рублей для поступления на любой курс онлайн-университета Skillbox!
источник
Data science [ru]
Скала | Принятие решений (если, если-еще, Вложено, если-еще, если-еще, если)
#Scala
Принятие решений в программировании аналогично принятию решений в реальной жизни. При принятии решения кусок кода выполняется, когда выполняется данное условие. Иногда они также называются операторами потока управления. Scala использует управляющие операторы для управления потоком выполнения программы на основе определенных условий. Они используются для продвижения и выполнения потока выполнения в зависимости от изменений состояния программы.
источник
2020 September 24
Data science [ru]
Hadoop YARN Архитектура
#Hadoop

YARN расшифровывается как « Еще один переговорщик по ресурсам ». Он был введен в Hadoop 2.0 для устранения узких мест в Job Tracker, который присутствовал в Hadoop 1.0. YARN был описан как « Redesigned Resource Manager » во время его запуска, но теперь он превратился в крупномасштабную распределенную операционную систему, используемую для обработки больших данных.
источник
Data science [ru]
Модуль pickle
#Python

Модуль pickle реализует мощный алгоритм сериализации и десериализации объектов Python. "Pickling" - процесс преобразования объекта Python в поток байтов, а "unpickling" - обратная операция, в результате которой поток байтов преобразуется обратно в Python-объект. Так как поток байтов легко можно записать в файл, модуль pickle широко применяется для сохранения и загрузки сложных объектов в Python.
источник
Data science [ru]
Уверены, что большинство из тех, кто сталкивается с задачей разметки данных, не нанимает для этого армию временных сотрудников, а запускает проекты в Толоке. Но для многих крауд-платформа - это такой черный ящик, в котором на входе ставится задача, а на выходе получается готовый датасет. При этом, чтобы получить действительно безупречный датасет,  важно не забывать про необходимость контроля качества  работы исполнителей. И у Толоки для этого есть несколько классных инструментов:

📍капча для защиты от автоматического прокликивания;
ограничение быстрых ответов, чтобы исполнители не спешили и внимательно читали посты и комментарии;
📍контрольные задания или проверку мнением большинства, чтобы отсеять исполнителей, которые допускают много ошибок;
📍агрегация ответов для получения более точный результат.
📍лимит на выполненные задания, чтобы не доверять значительную их часть одному исполнителю;
📍доступ по результатам проверки, чтобы не позволять выполнять задания тем,, кто невнимателен и часто ошибается;
📍обработка отклоненных заданий, чтобы собрать столько данных, сколько запланировано.

Правила и инструменты можно и нужно сочетать. Инструменты, эффективные для решения одних задач, зачастую могут быть неэффективны для других. Однако при их грамотной комбинации можно решать даже самые смелые и амбициозные задачи. Подробнее о том, как это делать, можно почитать здесь https://clck.ru/R2whp
источник
2020 September 25
Data science [ru]
Котлин для петли
#Kotlin

В Kotlin цикл for эквивалентен циклу foreach других языков, таких как C #. Здесь цикл for используется для обхода любой структуры данных, которая предоставляет итератор. Он используется совсем иначе, чем цикл for других языков программирования, таких как Java или C.
источник
Data science [ru]
​​Согласно исследованию Академии больших данных MADE и портала HH.ru, специалисты по анализу данных — одни из самых востребованных на рынке. В 2019 году вакансий в области анализа данных стало больше в 9,6 раза, чем в 2015 году. Спрос на дата-сайентистов постоянно растет, как и их зарплаты (в среднем — 140 000 рублей).

В SkillFactory стартует обновленный курс-тренажёр «Data Science». Python, машинное обучение, нейросети и deep learning, основы Big Data и Data engineering — всё это вы освоите на практических задачах и хакатона. А если что-то будет непонятно — менторы всегда на связи.

К концу обучения у вас будет готовое портфолио, а лучшие студенты будут трудоустроены.

🚀Запишитесь на курс со скидкой 40%: https://clc.am/8gDbjg
источник
Data science [ru]
Экосистема Hadoop
#Hadoop

Обзор: Apache Hadoop — это платформа с открытым исходным кодом, предназначенная для облегчения взаимодействия с большими данными. Однако для тех, кто не знаком с этой технологией, возникает вопрос: что такое большие данные? Большие данные — это термин, присваиваемый наборам данных, которые не могут быть эффективно обработаны с помощью традиционной методологии, такой как RDBMS. Hadoop занял свое место в отраслях и компаниях, которым необходимо работать с большими наборами данных, которые являются чувствительными и требуют эффективной обработки. Hadoop — это структура, которая позволяет обрабатывать большие наборы данных, которые находятся в форме кластеров. Будучи основой, Hadoop состоит из нескольких модулей, которые поддерживаются большой экосистемой технологий.
источник
2020 September 26
Data science [ru]
Искусственный интеллект снимает маски с омона
Никто не останется безнаказанным.
Белорусский художник и разработчик игр Андрей Максимов опубликовал видео, как нейросеть устанавливает силовиков на фотографиях и «срывает с них маски». Видео было опубликовано в Youtube.
«Все ваши лица будут возвращены на фото и видео ваших противозаконных действий, сколько бы носков вы ни наматывали себе на голову», — заявил автор видео.
«У вас есть последняя возможность уйти», — говорит Максимов на видео.
За неполный день видео набрало более 265 тысяч просмотров в YouTube.
источник
Data science [ru]
Скала | Сопоставление с образцом
#Scala

Сопоставление с образцом — это способ проверки заданной последовательности токенов на наличие определенного образца. Это наиболее широко используемая функция в Scala. Это метод проверки значения по шаблону.
Здесь вместо ключевого слова используется ключевое слово « match ». «Match» всегда определяется в корневом классе Scala, чтобы сделать его доступным для всех объектов. Это может содержать последовательность альтернатив. Каждая альтернатива будет начинаться с ключевого слова case . Каждый оператор case содержит шаблон и одно или несколько выражений, которые оцениваются, если указанный шаблон соответствует. Чтобы отделить шаблон от выражений, используется символ стрелки (=>) .
источник
2020 September 27
Data science [ru]
Модуль datetime
#Python

Модуль datetime предоставляет классы для обработки времени и даты разными способами. Поддерживается и стандартный способ представления времени, однако больший упор сделан на простоту манипулирования датой, временем и их частями.
источник
Data science [ru]
Анонимная функция в Go Language
#GO

Язык Go предоставляет специальную функцию, известную как анонимная функция. Анонимная функция — это функция, которая не содержит никакого имени. Это полезно, когда вы хотите создать встроенную функцию. В языке Go анонимная функция может образовывать замыкание. Анонимная функция также известна как  литерал функции .
источник
2020 September 28
Data science [ru]
Котлин пока петля
#Kotlin
В программировании цикл используется для многократного выполнения определенного блока кода, пока не будет выполнено определенное условие. Если вам нужно распечатать счет от 1 до 100, то вы должны написать оператор печати 100 раз. Но с помощью цикла вы можете сэкономить время и вам нужно написать только две строки.
источник