Size: a a a

Архитектура данных

2019 November 15

GK

Gennadiy Kruglov in Архитектура данных
А принципиально то, что есть сценарии, когда данные удобно хранить в больших файлах, которые можно быстро вычитывать частями параллельно для массовых трансформаций/вычислений
источник

GK

Gennadiy Kruglov in Архитектура данных
Теперь внимание
источник

GK

Gennadiy Kruglov in Архитектура данных
Речь идёт о splitable форматах, то есть именно тех форматах, в которых данные хранят в HDFS
источник

GK

Gennadiy Kruglov in Архитектура данных
Вот и всё собственно
источник

GK

Gennadiy Kruglov in Архитектура данных
Если вы строите озеро данных большой корпорации или гос. учреждения и вам нужно иметь хранилище первичных данных, часто с поддержкой историчности, там где это возможно, то альтернатив у Hadoop нет
источник

GK

Gennadiy Kruglov in Архитектура данных
А много ли других кейсов связанных с большими данными?))
источник

GK

Gennadiy Kruglov in Архитектура данных
И да, конечно там будет далеко не только Hadoop
источник

GK

Gennadiy Kruglov in Архитектура данных
Больше того, в комплексных транзакционно-аналитических решениях используются и прекрасно дружат как S3 так и HDFS
источник

PG

Paul Golubev in Архитектура данных
В последние годы стало больше альтернатив. Например логи можно в кликхаус сложить, файлы в условный ceph. Остальное неплохо ляжет в аналитические хранилища
источник

GK

Gennadiy Kruglov in Архитектура данных
Конечно
источник

PG

Paul Golubev in Архитектура данных
Сейчас как раз интересно, что будет развиваться с годами
источник

GK

Gennadiy Kruglov in Архитектура данных
Вопрос как потом это всё это собрать вместе
источник

GK

Gennadiy Kruglov in Архитектура данных
Paul Golubev
Сейчас как раз интересно, что будет развиваться с годами
Всё
источник

GK

Gennadiy Kruglov in Архитектура данных
Мы последние годы строим комплексные решения, в некотором смысле на Lambda архитектуре
источник

GK

Gennadiy Kruglov in Архитектура данных
И используем всё из перечисленного выше. И понимаем, что Ceph, HDFS и Clickhouse - не конкуренты, а партнёры
источник

GK

Gennadiy Kruglov in Архитектура данных
Мы - это я как архитектор и разные команды разных проектов
источник

GK

Gennadiy Kruglov in Архитектура данных
Еду в сапсане могу писать)
источник

GK

Gennadiy Kruglov in Архитектура данных
Поделюсь одной мыслью
источник

GK

Gennadiy Kruglov in Архитектура данных
Тут какие-то интересные ребята напугали интернет новостями о смерти хадупа. Клаудера упала в цене, не помню точно, в три раза вроде
источник

GK

Gennadiy Kruglov in Архитектура данных
И это связали со смертью хадупа
источник