Size: a a a

2020 June 23

c

codingteam@cjr in codingteam
Orhideous
Хотя, между нами, с ним больше мороки, чем толку.
источник

t

ttldtor in codingteam
а он точно для хранения?
источник

c

codingteam@cjr in codingteam
Orhideous
Нет, он только для вычислений. Выгребать и трансформировать данные. А уже они могут хоть в постгре, хоть в монге, хоть в варпе храниться.
источник

c

codingteam@cjr in codingteam
Orhideous
> «У нас было 2 инстанса PostgreSQL, 10 Тб неструктурированных данных, 5 Spark-нод, полкластера DataNodes и целое множество ETL-фреймворков всех сортов и расцветок, HDFS, а также Zookeeper, ClickHouse, Airflow, Oozie, Hue, Hadoop и 2 дюжины репозиториев с SQL-кодом. Не то чтобы это был необходимый запас для работы с большими данными, но если начал выстраивать архитектуру ETL-процессов, становится трудно остановиться. Единственное, что вызывало у меня опасение — это HiveServer 1.2.1. Ничто в мире не бывает более беспомощным, безответственным и порочным, чем несовмесимые версии Hive Metastore и Triftserver. Я знал, что рано или поздно мы перейдем и на эту дрянь.»
> - Страх и ненависть в бигдате
источник

MK

Matwey Kornilov in codingteam
codingteam@cjr
Orhideous
Нет, он только для вычислений. Выгребать и трансформировать данные. А уже они могут хоть в постгре, хоть в монге, хоть в варпе храниться.
Хоть
источник

MK

Matwey Kornilov in codingteam
Хоть в постгре
источник

c

codingteam@cjr in codingteam
Minoru
@fvnever: возможно, я не так прочитал, но мне показалось, что это протокол для последней мили, между пользователем и его провайдерским DNS. А то, что ты говоришь, и правда имело бы смысл между рекурсивными резолверами и авторитетными серверами
источник

MK

Matwey Kornilov in codingteam
И делать фулл-скан сутки
источник

MK

Matwey Kornilov in codingteam
Ох уж эти современные программисты
источник

MK

Matwey Kornilov in codingteam
Которые пишут интерфейс над интерфейсом интерфейсов
источник

c

codingteam@cjr in codingteam
Orhideous
Зачем фуллскан, ты чего.
источник

MK

Matwey Kornilov in codingteam
Ааа
источник

MK

Matwey Kornilov in codingteam
Точно
источник

MK

Matwey Kornilov in codingteam
У меня же задача неправильная!
источник

MK

Matwey Kornilov in codingteam
Ну да
источник

c

codingteam@cjr in codingteam
Orhideous
Перефразирую: а сколько ж у тебя данных?
источник

MK

Matwey Kornilov in codingteam
Пара терабайт
источник

t

ttldtor in codingteam
Matwey Kornilov
Которые пишут интерфейс над интерфейсом интерфейсов
и абстрагируются от абстракций над абстракциями и возводят фасадики на фасадиками фасадиков
источник

t

ttldtor in codingteam
пидоры
источник

c

codingteam@cjr in codingteam
Orhideous
Тогда, наверное, и спарк не особо нужен, да.
источник