Size: a a a

Архитектура данных

2019 November 15

GK

Gennadiy Kruglov in Архитектура данных
Fedor Lavrentyev
S3 + Databricks Delta, например
Да
источник

PG

Paul Golubev in Архитектура данных
Конечно, в нашей стране это не очень, но в целом там есть ряд решений, реализованных по похожему принципу
источник

GK

Gennadiy Kruglov in Архитектура данных
Продолжу мысль
источник

FL

Fedor Lavrentyev in Архитектура данных
Map Reduce уже давно мёртв, YARN дотухает, HDFS тоже уже легаси
источник

FL

Fedor Lavrentyev in Архитектура данных
Что осталось от хадупа? :)
источник

GK

Gennadiy Kruglov in Архитектура данных
Да, но нет
источник

GK

Gennadiy Kruglov in Архитектура данных
Продолжу мысль
источник

PG

Paul Golubev in Архитектура данных
+ в облаках дешевле стоимость аппаратных ресурсов, чем у себя. А хадуп именно этим выделялся
источник

GK

Gennadiy Kruglov in Архитектура данных
Для чего хорошо подходят облачные хранилища?
источник

GK

Gennadiy Kruglov in Архитектура данных
В чём ключевое отличие S3 от HDFS?
источник

GK

Gennadiy Kruglov in Архитектура данных
Paul Golubev
+ в облаках дешевле стоимость аппаратных ресурсов, чем у себя. А хадуп именно этим выделялся
А вот и нет
источник

GK

Gennadiy Kruglov in Архитектура данных
Далеко не всегда
источник

PG

Paul Golubev in Архитектура данных
Ну это как везде, в чистой стоимости не всегда. Но соотношение стоимости и профита и велосити в целом выше
источник

GK

Gennadiy Kruglov in Архитектура данных
Paul Golubev
Ну это как везде, в чистой стоимости не всегда. Но соотношение стоимости и профита и велосити в целом выше
В целом, но только не при хранении большого объёма сырых данных и последующей их массовой обработкой со значительной утилизацией почти всех ресурсов кластеров почти 24 часа в сутки
источник

GK

Gennadiy Kruglov in Архитектура данных
Итак, в чём разница?
источник

GK

Gennadiy Kruglov in Архитектура данных
S3 - это REST протокол к объектным хранилищам
источник

GK

Gennadiy Kruglov in Архитектура данных
В объектных хранилищах удобно хранить большое число мелких файлов, ортогонально HDFS
источник

GK

Gennadiy Kruglov in Архитектура данных
К чему это приводит?
источник

GK

Gennadiy Kruglov in Архитектура данных
К тому, что загрузить данные в объектный стор можно только одним способом - посредством S3, то есть через REST
источник

GK

Gennadiy Kruglov in Архитектура данных
Но это не принципиально
источник