Телеграмм чат группы rockyourdata страница 16

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Инжиниринг Данных

6805 membersпожаловаться на группу

1
«
…
‹
11
12
13
14
15
16
17
›
…
»

2019 April 24

Инжиниринг Данных

А так выглядит data lake by AWS. Все данных сохраняются в S3. Главный challenge это собрать метаданные, чтобы люди могли самостоятельно найти данные, которые им нужны.

источник

57523:58пожаловаться #1

2019 April 25

Инжиниринг Данных

Вот мой кейс, когда traditional ELT не смог справиться с объемом, загрузка одного файла в Redshift занимает 1мин, у меня 5600 файлов в день. Поэтому использовал EMR (Hadoop) + Spark (PySpark где описал логику трансформаций). Результат сохраняется в S3 в Parquet формате. AWS Glue Crawler сканирует файлы и обновляет External Table (Hive Metastore), как результат пользователи могут писать SQL запросы через Redshift Spectrum. Примерно такое же решение можно собрать в Azure и GCP.

источник

57100:02пожаловаться #2

Инжиниринг Данных

источник

53500:03пожаловаться #3

Инжиниринг Данных

источник

53700:03пожаловаться #4

Инжиниринг Данных

А вот ребята из Twitch, у них все по взрослому, 96 нод Redshift Cluster и 2.2 PB Parquet озеро данных в котором 1300 exernal tables. Главный challenge - Metadata

источник

51700:04пожаловаться #5

Инжиниринг Данных

Они написали свои тулзы - Sheik, для трансформаций

источник

51300:05пожаловаться #6

Инжиниринг Данных

Mode для exploration данных, аналог looker. Кстати про looker сказали, что хрень полная))

источник

53400:06пожаловаться #7

Инжиниринг Данных

Табло у них тоже есть

источник

55000:06пожаловаться #8

Инжиниринг Данных

Сейчас они активно внедряют Alation, как я понял очень крутой инструмент, собиарет метаданные из табло, хранилища и тп, собирает статистику по использованию таблиц, и вообще замечательный продукт. Такой же отзыв я слышал от ребят из GoDaddy.

источник

70700:08пожаловаться #9

Инжиниринг Данных

Когда мы говорим про Cloud Analytics, важно знать типы сервисов IaaS, CaaS, PaaS, FaaS, Saas. На картинке с пиццей видно преимущество каждого сервиса.

источник

82408:05пожаловаться #10

2019 April 26

Инжиниринг Данных

источник

64018:15пожаловаться #11

2019 April 27

Инжиниринг Данных

Свежый отчет Gartner по Традиционным Хранилищам Данных.

источник

59507:00пожаловаться #12

Инжиниринг Данных

https://info.matillion.com/webinar-machine-learning

[Webinar] Successful Machine Learning starts with Data Transformation

Your business needs to process and understand growing data volumes faster to generate meaningful insights - empowering data-driven decisions to be made across your organization. Machine learning can help you automate the data exploration and analysis process.

источник

57708:30пожаловаться #13

Инжиниринг Данных

Сегодня посещу Edmonton, а вот и презентация по Microsoft Azure Data Analytics https://www.slideshare.net/dimoobraznii/building-modern-data-platform-with-microsoft-azure

www.slideshare.net

Building Modern Data Platform with Microsoft Azure

This presentation will cover Cloud history and Microsoft Azure Data Analytics capabilities. Moreover, it has a real-world example of DW modernization. Finally,…

источник

57115:40пожаловаться #14

Инжиниринг Данных

Хорошая визуализация разделения ответственности между провайдером и клиентом

источник

63120:17пожаловаться #15

Инжиниринг Данных

https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/confronting-the-risks-of-artificial-intelligence

McKinsey & Company

Confronting the risks of artificial intelligence

Organizations can mitigate advanced-analytics and AI risks by embracing three principles.

источник

77320:28пожаловаться #16

2019 April 29

Инжиниринг Данных

Вот это крутая штука - бесплатная БД mysql - https://remotemysql.com/ всамый раз поучиться или собрать аналитику для своего проекта

источник

67023:58пожаловаться #17

2019 April 30

Инжиниринг Данных

https://www.inc.com/geoffrey-james/open-plan-offices-literally-make-you-stupid-according-to-harvard.html

Open-Plan Offices Literally Make You Stupid, According to Harvard

Because they discourage face-to-face interaction, open-plan offices reduce collective intelligence.

источник

56121:59пожаловаться #18

Инжиниринг Данных

Немного не в тему, но очень классная реклама Канады https://youtu.be/xYJ1LtTvofU

источник

55722:20пожаловаться #19

2019 May 01

Инжиниринг Данных

Хороший товарищ Тимур Мишин написал хорошую статью https://vc.ru/hr/66075-ne-vse-prodakt-menedzhery-odinakovo-polezny

Не все продакты одинаково полезны — Карьера на vc.ru

Как не впасть в карго-культ и создавать успешные тиражируемые продукты.

источник

54400:26пожаловаться #20

1
«
…
‹
11
12
13
14
15
16
17
›
…
»