Size: a a a

2019 October 14

DZ

Dmitry Zuev in Data Engineers
Там опция есть
источник

DZ

Dmitry Zuev in Data Engineers
Abi Palagashvili
Привет,ребят, у меня есть спарк-датафрейм,в нём колонка типа double/float.Пишу этот датафрейм csv-шником в hdfs, но числа пишутся в экспоненциальной записи.Пробовал DecimalType(20,19) - не помогает, нули пишутся в виде 0E-19.Можно как-то это победить?
Как пробовал?
источник

AP

Abi Palagashvili in Data Engineers
Dmitry Zuev
Как пробовал?
withColumn("purchaseCasted", result("purchase").cast(DecimalType(20, 20))).show(10)
источник
2019 October 15

C

Combot in Data Engineers
niazi Sinan has been banned! Reason: CAS ban.
источник

В

Вадим in Data Engineers
Ребят, у кого на работе есть data quality отдел?
источник

VE

Vladimir E. in Data Engineers
Вадим
Ребят, у кого на работе есть data quality отдел?
А в чём вопрос? Вообще обычно DQ занимаются Data Governance отделы, но знаю компании где DQ отдельно работает
источник

В

Вадим in Data Engineers
Vladimir E.
А в чём вопрос? Вообще обычно DQ занимаются Data Governance отделы, но знаю компании где DQ отдельно работает
в чем вообще их работа состоит?
источник

В

Вадим in Data Engineers
чем они занимаются?
источник

VE

Vladimir E. in Data Engineers
Ну например проверяют то насколько сорс системы и новые загрузки данных соответсвуют качеству для их анализа. Проверяют соответствие бизнес правилам (которых бывает тысячи) и в некоторых случаях ещё и чистят/стандартизируют для загрузки в какой-нить дата март
источник

VE

Vladimir E. in Data Engineers
там конечно много всего ещё есть
источник

В

Вадим in Data Engineers
ака тестировщик-аналитик?
источник

VE

Vladimir E. in Data Engineers
Ну тестировщиками их никто не называет, это могут быть например ETL инженеры которые принимают таски от бизнеса - типа хотим чтоб у нас были проверки на вот этой сорс системе, и уже в отделе их имплементируют
источник

В

Вадим in Data Engineers
Vladimir E.
Ну тестировщиками их никто не называет, это могут быть например ETL инженеры которые принимают таски от бизнеса - типа хотим чтоб у нас были проверки на вот этой сорс системе, и уже в отделе их имплементируют
ох, я понял
источник

В

Вадим in Data Engineers
спасибо большое
источник

VE

Vladimir E. in Data Engineers
без DQ/DG отделов обычно проверки делаются напрямую аналитиками через SQL запросы на сорс системах, но потом возникают проблемы что эти правила хочется иметь в одном месте и хочется запускаь их не только на каком-нибудь оракле, а ещё например на S3 и хадупе
источник

В

Вадим in Data Engineers
То есть, под это все еще и инструменты есть
источник

VE

Vladimir E. in Data Engineers
Куча :) Я как раз работаю в одном из вендоров который специализируется на DQ
источник

DZ

Dmitry Zuev in Data Engineers
Вендор, DQ - понятно
источник

K

KrivdaTheTriewe in Data Engineers
Vladimir E.
Куча :) Я как раз работаю в одном из вендоров который специализируется на DQ
а что за вендор, если не секрет?
источник

VE

Vladimir E. in Data Engineers
Ataccama, у нас тут data catalog, data quality и master data management, сидим в основном в Праге
источник