Ключевая мысль. В озере данных данные уже собраны в RAW слое, хранятся в HDFS, в больших файлах, которые легко вычитывать большими порциями параллельно, причём близко к вычислениям
Есть ещё конечно общая проблема извлечения валуя из больших данных. А если говорить откровенно, то монетизации данных. Но технологии то тут ни при чём. Просто спал хайп, ну и прекрасно.
Ты в поезде обратно что ли поехал, чтобы ещё написать что-нить? :) Кстати, спасибо за написанное. Мы тоже недавно обсуждали Hadoop и сходу ничего не придумали альтернативного для батч обработки больших файлов
Ты в поезде обратно что ли поехал, чтобы ещё написать что-нить? :) Кстати, спасибо за написанное. Мы тоже недавно обсуждали Hadoop и сходу ничего не придумали альтернативного для батч обработки больших файлов