Телеграмм чат группы hadoopusers страница 1902

думаю там написано что т.к. хбейз констситентен и партишн толерантен то узлы могут не одномоментно отвечать а могут и ваще по таймауту отваливаться хоть все сразу

источник

23:23пожаловаться #13

Grigory Pomadchin in Data Engineers

чисто чтоб в кап треугольник включить

источник

23:23пожаловаться #14

Евгений in Data Engineers

нууу ок.

источник

23:24пожаловаться #15

Евгений in Data Engineers

спасибо

источник

23:24пожаловаться #16

Anton Shelin in Data Engineers

Oleg

У кого был опыт построения dwh на sql server? Есть компания у кого эта бд везде и они хотят сделать аналитическую бд, объемы данных такие что hadoop или какой-нибудь greenplum будет оверхедом. Плюс у них уже есть свои etl простые, написаны процедуры для аналитики и прочего, вообщем mssql проник в компанию очень прочно. Есть какие-то общие подходы, архитектурные паттерны, встроенные стредства для этой бд?

Если все отчеты можно заранее аггрегировать то скул ок. Если надо адхок отчеты то лучше колоночную базу завести. Ну или готовое решение типа azure sql warehouse. Я как то пробовал адхоок делать отчеты в мс скул используя колоночные индексы но производительность была так себе.

источник

23:26пожаловаться #17

Anon 43 in Data Engineers

Grigory Pomadchin

ты лучше напиши что такое C, A и P; тогда вопроса почему HBase это CP не будет

да было бы время, сам бы все поискал

источник

23:34пожаловаться #18

Anon 43 in Data Engineers

после НГ читать буду, щас курсовую делать по другому предмету

источник

23:35пожаловаться #19

Grigory Pomadchin in Data Engineers

Что-то пропустил слегка я новости поповоду EMR 6.0: https://aws.amazon.com/about-aws/whats-new/2019/11/amazon-emr-6-beta-2-adds-hive-3-with-llap-support-scala-212-with-spark-244/

Похоже даже амазон дропает скоро 2.11 наконец (не дожидаясь релиза Спарка 3).

Amazon Web Services, Inc.

Amazon EMR 6.0 (Beta 2) adds Hive 3 with LLAP support, and Scala 2.12 with Spark 2.4.4

источник

23:42пожаловаться #20