Телеграмм чат группы rockyourdata страница 14

Size: a a a

Инжиниринг Данных

2019 March 27

Написал пост про стратегии миграции для облачной аналитики https://medium.com/rock-your-data/cloud-analytics-migration-strategies-74af248de066

Medium

Cloud Analytics Migration Strategies

Nowadays, speed and timing matter. This agility combined with innovation has proven to be a game-changer for several organizations across…

источник

71001:07пожаловаться #1

Инжиниринг Данных

https://blog.aboutamazon.com/innovation/the-story-behind-amazons-next-generation-robot

About Amazon

The story behind Amazon's next generation robot

At Amazon, inventors are patenting their ideas and seeing their inventions come to life.

источник

78606:18пожаловаться #2

2019 March 28

Инжиниринг Данных

https://analytikaplus.ru/analytix-meetup-2019/

analytikaplus.ru

AnalytiX MeetUP 2019 | АНАЛИТИКА ПЛЮС

Это митап только для аналитиков и только про аналитику - принимают участие компании-клиенты АНАЛИТИКА ПЛЮС. Это место встречи единомышленников. Это общение и обмен опытом. Это полезные доклады - только практика, только реальные кейсы.

источник

67400:39пожаловаться #3

Инжиниринг Данных

Мы все тут говорим про роботов, автоматизацию, большие данные, аналитику и все в этом духе. А вот Амазон выпустил свою линию Beauty продуктов.

Опять же без данных не обошлось. Все банально просто. Amazon это marketplace. У вас есть уникальный продукт и вы его продаете на Amazon, данные собираются, а потом, раз и Amazon выпускает свой бренд. Если вы знакомы с AmazonBasics, то это другой бренд, там батарейки, коврики, посуда. Все, что там есть, это тоже не просто так, значит эти товары пользовались большим спросом, кто-то неплохо зарабатывал на этих категориях.

Вот так вот Amazon, забирает все самое лучше, и становиться еще богаче.

Вот вам простой пример ценности информации.

Amazon.com

Belei: Home page

Belei Skin Care: Moisturizers, Serums, Cleansers and more for your skin care needs

источник

84401:24пожаловаться #4

Инжиниринг Данных

https://habr.com/ru/company/newprolab/blog/337938/

Хабр

4 причины стать Data Engineer

Привет, Хабр! На данный момент в Data Science образовался огромный перекос в сторону data scientist-ов, об этой профессии сейчас знают даже те, кто никак не связ...

источник

71318:02пожаловаться #5

Инжиниринг Данных

https://rb.ru/opinion/data-engineer-modeli-data-scientist/

Rusbase

В России катастрофически не хватает инженеров данных – кому и зачем они нужны

Разбираемся, в чем отличие Data Engineer от Data scientist

источник

79418:04пожаловаться #6

Инжиниринг Данных

Все знают про формат TXT, CSV. Но для большых данных лучше всего подходит Parquet. (Это связано с проектами по болишим данным, Hadoop, Spark, Data Lake)

источник

85621:39пожаловаться #7

Инжиниринг Данных

А вот резльтаты сравнения Netflix, они запускали Hive и Presto (SQL движок для Hadoop) на базе Amazon S3 и HDFS (локальный сторадж Hadoop). Они сравнивали производительность TXT, ORC и Parquet.

Medium

Using Presto in our Big Data Platform on AWS

low-latency interactive data exploration

источник

110923:32пожаловаться #8

2019 April 04

Инжиниринг Данных

Dive into Deep Learning
An interactive deep learning book with code, math, and discussions http://d2l.ai/

источник

81008:23пожаловаться #9

Инжиниринг Данных

Привет, вот есть вакансия Data Engineer:

Data engineer в частный российский банк, которому предстоит погружение в классные проекты (не скоринг) по продуктам банка.
Обязанности:
• Развитие хранилища данных на базе Hadoop. Ответственность за построение data lake.
• Помощь аналитикам данных (data scientist) с загрузкой, обработкой и обогащением данных
• Обеспечение соответствия систем требованиям бизнеса и отраслевым практикам
• Разработка новых инструментов и сервисов

Требования:
• Минимум 2 года опыта на аналогичной позиции
• Практические знания стека Hadoop (Spark, Flink, Kafka, Hive, Scoop итд).
• Уверенное владение одним из языков программирования: Java, Scala, Python
• Опыт работы с промышленными SQL и NoSQL базами данных
• Фокус на бизнес-ориентированность в сочетании с аналитическим мышлением.
• Инновационное мышление, открытость к переменам и стремление к совершенству.

Зарплатная вилка 250000 рублей гросс/нетт

писать Варваре Матиссен-Рожковой в телеграм @heinin или на почту varvaram@marksmans.ru

источник

90716:59пожаловаться #10

Инжиниринг Данных

Пример использования snowflake и matillion с инструкцией https://community.snowflake.com/s/article/Getting-Started-with-Snowflake-and-Matillion

источник

88117:38пожаловаться #11

Инжиниринг Данных

“Life is pretty simple: You do some stuff. Most fails. Some works. You do more of what works. If it works big, others quickly copy it. Then you do something else. The trick is the doing something else.”
― Tom Peters

источник

93121:01пожаловаться #12

2019 April 05

Инжиниринг Данных

https://bit.ly/2HlszFs

Datasciencecentral

An absolute beginner’s guide to machine learning, deep learning, and AI

This article was posted by SmileJet on Dev Battles.
Meet Samantha. She’s your friendly assistant from 2025. She sorts your mail, sets up your meetings, and ord…

источник

87217:19пожаловаться #13

2019 April 06

Инжиниринг Данных

https://christophm.github.io/interpretable-ml-book/index.html

christophm.github.io

Interpretable Machine Learning

Machine learning algorithms usually operate as black boxes and it is unclear how they derived a certain decision. This book is a guide for practitioners to make machine learning decisions interpretable.

источник

88409:07пожаловаться #14

2019 April 07

Инжиниринг Данных

источник

67521:38пожаловаться #15

2019 April 08

Инжиниринг Данных

https://www.analytics.today/blog/four-stages-that-revolutionised-database-architecture

Four Stages that Revolutionised Database Architecture

An overview of database architectures leading to the Snowflake Data Warehouse

источник

67603:15пожаловаться #16

Инжиниринг Данных

https://www.linkedin.com/pulse/cost-optimizing-bigquery-part-1-collecting-data-rogier-werschkull

Cost optimizing BigQuery - part 1: collecting data

What is this about?: The purpose of this 2-part article series is to give an complete overview on how to investigate (part 1) and optimize (part 2) the costs for your BigQuery setup in a Datawarehousing / ETL pipeline context. Starting at ingestion time, all the way towards to use of modern ‘Direct-

источник

68505:53пожаловаться #17

Инжиниринг Данных

0.pdf

(978.86 Кб)

Google Data Engineering *Cheat Sheet*

источник

98206:29пожаловаться #18

2019 April 09

Инжиниринг Данных

Для всех любителей создавать модели данных (не предиктивные), а именно модели, диаграммы и схемы, отличный продукт - SQLDBM уже 2 года на рынке, скоро выйдет версия для Snowflake и Redshift. Вот можете посмотреть тур продукта https://app.sqldbm.com/SQLServer/Share/u_Gp72CUN4St73B28Y5yMUGFrngIE8md_DYjF4jNYw0 Жду когда будет для Snowflake/Redshift, будет интересно.

источник

208708:08пожаловаться #19

2019 April 10

Инжиниринг Данных

https://www.ted.com/talks/kenneth_cukier_big_data_is_better_data

Ted

Big data is better data

Self-driving cars were just the start. What's the future of big data-driven technology and design? In a thrilling science talk, Kenneth Cukier looks at what's next for machine learning -- and human knowledge.

источник

66508:42пожаловаться #20