Size: a a a

2019 December 17

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
спарк можете через jdbc натравить напрямки
да я потом инструмнет допилю типа скупа
источник

K

KrivdaTheTriewe in Data Engineers
но на спарке
источник

K

KrivdaTheTriewe in Data Engineers
как показала практика оч удобно
источник

K

KrivdaTheTriewe in Data Engineers
а не эгенист конкретная таблица
источник

AZ

Anton Zadorozhniy in Data Engineers
я вообще щас посмотрел, он же конвертить в WKT CLOB на выгрузке, у вас валится сейчас конкретная джоба?
источник

AZ

Anton Zadorozhniy in Data Engineers
попробуйте split.by.amp
источник

AZ

Anton Zadorozhniy in Data Engineers
вы же TDCH используете, правильно?
источник

K

KrivdaTheTriewe in Data Engineers
да
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
попробуйте split.by.amp
его и пробовал
источник

AZ

Anton Zadorozhniy in Data Engineers
split.by.hash?
источник

K

KrivdaTheTriewe in Data Engineers
там не в хеше дело., там падает сча покажу с чем
источник

AZ

Anton Zadorozhniy in Data Engineers
ДМ
источник

K

KrivdaTheTriewe in Data Engineers
господа, я ввел в заблуждение коннектором, другой коннектор используется. cloudera коннектор в терадату
источник

A4

Anon 43 in Data Engineers
В спарке смотрю чужой код. часто встречаю свойство ._2
это что?
источник

A4

Anon 43 in Data Engineers
есть даже метод ._2()
источник

AS

Anton Shelin in Data Engineers
Второй компонент тюпла
источник

A4

Anon 43 in Data Engineers
а, это скала
источник

A4

Anon 43 in Data Engineers
разобрался
источник

O

Oleg in Data Engineers
У кого был опыт построения dwh на sql server?  Есть компания у кого эта бд везде и они хотят сделать аналитическую бд, объемы данных такие что hadoop или какой-нибудь greenplum будет оверхедом. Плюс у них уже есть свои etl простые, написаны процедуры для аналитики и прочего, вообщем mssql проник в компанию очень прочно. Есть какие-то общие подходы,  архитектурные паттерны, встроенные стредства для этой бд?
источник

СХ

Старый Хрыч in Data Engineers
Oleg
У кого был опыт построения dwh на sql server?  Есть компания у кого эта бд везде и они хотят сделать аналитическую бд, объемы данных такие что hadoop или какой-нибудь greenplum будет оверхедом. Плюс у них уже есть свои etl простые, написаны процедуры для аналитики и прочего, вообщем mssql проник в компанию очень прочно. Есть какие-то общие подходы,  архитектурные паттерны, встроенные стредства для этой бд?
фсрар пробовал, но в итоге отказался от такого варианта, перейдя на выборку по sql серверу и переносу данных в vertica
источник