Size: a a a

2019 December 17

GP

Grigory Pomadchin in Data Engineers
это что еще?
источник

A4

Anon 43 in Data Engineers
нашел
источник

A4

Anon 43 in Data Engineers
спасибо
источник

GP

Grigory Pomadchin in Data Engineers
Anon 43
спасибо
ты лучше напиши что такое C, A и P; тогда вопроса почему HBase это CP не будет
источник

Е

Евгений in Data Engineers
разве разделение это не P?
источник

GP

Grigory Pomadchin in Data Engineers
Евгений
разве разделение это не P?
не знаю в чем у тебя вопрос; но очевидно что на авиабилити у хбейз компромисы
источник

GP

Grigory Pomadchin in Data Engineers
источник

Е

Евгений in Data Engineers
ну в смысле partition tolerance это же как раз про разделение кластера
источник

Е

Евгений in Data Engineers
нет?
источник

GP

Grigory Pomadchin in Data Engineers
ты про что? у тебя вопрос почему CP или что?
источник

Е

Евгений in Data Engineers
я про его скриншот
источник

Е

Евгений in Data Engineers
с вопросом
источник

GP

Grigory Pomadchin in Data Engineers
думаю там написано что т.к. хбейз констситентен и партишн толерантен то узлы могут не одномоментно отвечать а могут и ваще по таймауту отваливаться хоть все сразу
источник

GP

Grigory Pomadchin in Data Engineers
чисто чтоб в кап треугольник включить
источник

Е

Евгений in Data Engineers
нууу ок.
источник

Е

Евгений in Data Engineers
спасибо
источник

AS

Anton Shelin in Data Engineers
Oleg
У кого был опыт построения dwh на sql server?  Есть компания у кого эта бд везде и они хотят сделать аналитическую бд, объемы данных такие что hadoop или какой-нибудь greenplum будет оверхедом. Плюс у них уже есть свои etl простые, написаны процедуры для аналитики и прочего, вообщем mssql проник в компанию очень прочно. Есть какие-то общие подходы,  архитектурные паттерны, встроенные стредства для этой бд?
Если все отчеты можно заранее аггрегировать то скул ок. Если надо адхок отчеты то лучше колоночную базу завести. Ну или готовое решение типа azure sql warehouse. Я как то пробовал адхоок делать отчеты в мс скул используя колоночные индексы но производительность была так себе.
источник

A4

Anon 43 in Data Engineers
Grigory Pomadchin
ты лучше напиши что такое C, A и P; тогда вопроса почему HBase это CP не будет
да было бы время, сам бы все поискал
источник

A4

Anon 43 in Data Engineers
после НГ читать буду, щас курсовую делать по другому предмету
источник

GP

Grigory Pomadchin in Data Engineers
Что-то пропустил слегка я новости поповоду EMR 6.0: https://aws.amazon.com/about-aws/whats-new/2019/11/amazon-emr-6-beta-2-adds-hive-3-with-llap-support-scala-212-with-spark-244/

Похоже даже амазон дропает скоро 2.11 наконец (не дожидаясь релиза Спарка 3).
источник