Size: a a a

Архитектура данных

2019 November 15

GK

Gennadiy Kruglov in Архитектура данных
Paul Golubev
Логи до сих пор многие хранят в реляционках, и даже файлы)
Да, вообще-то) но мы же о больших данных говорим?
источник

PG

Paul Golubev in Архитектура данных
Заметил, что для каждой задачи стали появляться свои удобные средства и вроде как уже нет потребности большой в хадупе, тем более что хранилища метаданных стали мультисервисными, сети лучше, облака мощнее. Как думаете, отомрет через пять десять лет?
источник

GK

Gennadiy Kruglov in Архитектура данных
Нет конечно, не отомрёт
источник

GK

Gennadiy Kruglov in Архитектура данных
Потому что пока только на Hadoop удобно и дёшево строить Batch и Serving слои Lambda архитектуры
источник

GK

Gennadiy Kruglov in Архитектура данных
В Hadoop удобно загружать и хранить сырые данные, выполнять трансформации и вычисления на петабайтах данных
источник

GK

Gennadiy Kruglov in Архитектура данных
Имею ввиду экосистему Hadoop
источник

GK

Gennadiy Kruglov in Архитектура данных
Что может убить именно Hadoop?
источник

GK

Gennadiy Kruglov in Архитектура данных
И что такое Hadoop?
источник

PG

Paul Golubev in Архитектура данных
Если говорить в классическом варианте, то это файловая система
источник

GK

Gennadiy Kruglov in Архитектура данных
Очень упрощённо, Hadoop - это HDFS, YARN и Map Reduce
источник

PG

Paul Golubev in Архитектура данных
Потом начала обрастать утилитами для манипулирования данными в этой фс
источник

PG

Paul Golubev in Архитектура данных
Потом эти утилиты стали работать не только с hdfs - и теперь я не знаю что можно причислить к экосистеме именно хадуп, имхо эксклюзива почти не осталось
источник

GK

Gennadiy Kruglov in Архитектура данных
Paul Golubev
Если говорить в классическом варианте, то это файловая система
Да, но очень специфическая. Она хорошо подходит для хранения больших файлов. Относительно небольшого числа больных по объёму файлов
источник

GK

Gennadiy Kruglov in Архитектура данных
Paul Golubev
Потом эти утилиты стали работать не только с hdfs - и теперь я не знаю что можно причислить к экосистеме именно хадуп, имхо эксклюзива почти не осталось
Точно, но есть нюанс
источник

GK

Gennadiy Kruglov in Архитектура данных
Что может стать конкурентом HDFS?
источник

PG

Paul Golubev in Архитектура данных
Облака и что там развернуто
источник

GK

Gennadiy Kruglov in Архитектура данных
Paul Golubev
Облака и что там развернуто
Нет
источник

GK

Gennadiy Kruglov in Архитектура данных
Объектные хранилища.
источник

FL

Fedor Lavrentyev in Архитектура данных
Gennadiy Kruglov
Что может стать конкурентом HDFS?
S3 + Databricks Delta, например
источник

GK

Gennadiy Kruglov in Архитектура данных
И облачные сервисы поверх объектных хранилищ
источник