Size: a a a

2021 March 30

K

KrivdaTheTriewe in Data Engineers
Alex
То-то spark sql выжирает большую часть всех случаев использования спарка :)

И они активно ansi к нему прикручивают
да на спарке свой dbt седалть легко
источник

K

KrivdaTheTriewe in Data Engineers
скорее для того, чтобы можно было BI прикрутить, поэтому анси
источник

K

KrivdaTheTriewe in Data Engineers
Alex
То-то spark sql выжирает большую часть всех случаев использования спарка :)

И они активно ansi к нему прикручивают
ну как бы датафрейм и скуль апи эквивалентны
источник

A

Alex in Data Engineers
Ну хзхз, некоторые сложные запросы в df мозг сломать можно
источник

K

KrivdaTheTriewe in Data Engineers
ЭТО ДРУГОЕ
источник

A

Alex in Data Engineers
KrivdaTheTriewe
скорее для того, чтобы можно было BI прикрутить, поэтому анси
то есть это для того чтобы превратить спарк в пускалку sql кода, больше от него ничего не требуется для этих BI тулов
источник

K

KrivdaTheTriewe in Data Engineers
Alex
то есть это для того чтобы превратить спарк в пускалку sql кода, больше от него ничего не требуется для этих BI тулов
а потом у вас фукнции на sql , чтоб ip вытащить из поля
источник

A

Alex in Data Engineers
источник

A

Alex in Data Engineers
такие дела
источник

K

KrivdaTheTriewe in Data Engineers
источник

e

er@essbase.ru in Data Engineers
Dbt это история про dynamic sql ? Что то ещё она интересное несёт в себе ?
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Реята, которые используют dbt , скажите как вы живете и отлаживаете эти все макросы и простыни sql кода? Неужели нет желания делать etl типизированым?
Типизация же не самоцель, это ради safety делается, которую в случае с SQL логикой пытаются достичь ассертами и тестами
источник

AZ

Anton Zadorozhniy in Data Engineers
Конечно люди не от хорошей жизни это делают, выразительность SQL по сравнению с любым general purpose языком сильно хромает; но писать декларативный type safe DSL не все готовы, какого-то общего пока не появилось, а у SQL низкий порог входа, а СУБД очень шустрые и их мощь хочется использовать
источник

b

burzum in Data Engineers
KrivdaTheTriewe
Реята, которые используют dbt , скажите как вы живете и отлаживаете эти все макросы и простыни sql кода? Неужели нет желания делать etl типизированым?
Это же не весь etl, а только трансформации. А вообще sql бывает типизированным?
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
да на спарке свой dbt седалть легко
Но Спарк и не всем подходит, у него понятная область применимости но за рамками это области - очень больно и очень дорого (ну или ждать пока delta engine всем дадут)
источник

b

burzum in Data Engineers
KrivdaTheTriewe
а потом у вас фукнции на sql , чтоб ip вытащить из поля
как-будто что-то плохое 😃
источник

b

burzum in Data Engineers
да и ребята пилят поддержку спарка - https://github.com/fishtown-analytics/dbt-spark
источник

AZ

Anton Zadorozhniy in Data Engineers
burzum
Это же не весь etl, а только трансформации. А вообще sql бывает типизированным?
Имеются в виду всякие spark dataset, frameless, такие подходы
источник

PK

Pavel Klemenkov in Data Engineers
burzum
Это же не весь etl, а только трансформации. А вообще sql бывает типизированным?
Кажется, что сделать декларативный язык нетипизированным гораздо сложнее, чем типизированным
источник

b

burzum in Data Engineers
Pavel Klemenkov
Кажется, что сделать декларативный язык нетипизированным гораздо сложнее, чем типизированным
Да, конечно, прошу прощения, я неправильно выразился, я скорее имел ввиду подход к написанию кода (?) в sql. Ну, типа, я же не декларирую тип каждой колонки заранее, я просто делаю select и уже получаю типы колонок на выходе, кроме тех случаев когда явно делаю преобразования типов. Вот и получается, что порой из самого sql кода тип колонки определить явно не получится,  кроме как запустить его и посмотреть тип в итоговой таблице.
источник