Size: a a a

2021 April 05

AZ

Anton Zadorozhniy in Data Engineers
Повелитель Бури
что значит был? )
Кмк сейчас больше наливают хранилище или независимые витрины из даталейка, так не надо делать оффлоад)
источник

N

Nikita Blagodarnyy in Data Engineers
Asd Fgh
У нас тут до сих пор начало нулевых, месяц назад днс заработал 🙈
сервер?
источник

AF

Asd Fgh in Data Engineers
Ага
источник

AG

Alexander Gorokhov in Data Engineers
Помнится задавал вопрос в этом чате, как достать инфу которую спарк показывает в spark ui. В итоге родилось вот что:
https://github.com/sashgorokhov/pyspark-spy - само собирает спарк ивенты и можно без дополнительных екшонов узнать сколько строчек прочитало или записано во время спарк джобы. Это только пример, еще можно узнать сколько шафла было, сколько байт прочитано/записано. В принципе почти все цифры которые можно найти в spark ui.
источник

AB

Andrey Bel in Data Engineers
Alexander Gorokhov
Помнится задавал вопрос в этом чате, как достать инфу которую спарк показывает в spark ui. В итоге родилось вот что:
https://github.com/sashgorokhov/pyspark-spy - само собирает спарк ивенты и можно без дополнительных екшонов узнать сколько строчек прочитало или записано во время спарк джобы. Это только пример, еще можно узнать сколько шафла было, сколько байт прочитано/записано. В принципе почти все цифры которые можно найти в spark ui.
круто, спасибо, надо попробовать
источник

SS

Sergey Sheremeta in Data Engineers
Alexander Gorokhov
Помнится задавал вопрос в этом чате, как достать инфу которую спарк показывает в spark ui. В итоге родилось вот что:
https://github.com/sashgorokhov/pyspark-spy - само собирает спарк ивенты и можно без дополнительных екшонов узнать сколько строчек прочитало или записано во время спарк джобы. Это только пример, еще можно узнать сколько шафла было, сколько байт прочитано/записано. В принципе почти все цифры которые можно найти в spark ui.
прометей, графана?
источник

AG

Alexander Gorokhov in Data Engineers
Sergey Sheremeta
прометей, графана?
Нету :(
источник

AK

Alena Korogodova in Data Engineers
Alexander Gorokhov
Помнится задавал вопрос в этом чате, как достать инфу которую спарк показывает в spark ui. В итоге родилось вот что:
https://github.com/sashgorokhov/pyspark-spy - само собирает спарк ивенты и можно без дополнительных екшонов узнать сколько строчек прочитало или записано во время спарк джобы. Это только пример, еще можно узнать сколько шафла было, сколько байт прочитано/записано. В принципе почти все цифры которые можно найти в spark ui.
А это не подошло?

https://github.com/lucacanali/sparkMeasure
источник
2021 April 06

VS

Vladislav 👻 Shishkov... in Data Engineers
jmx же? А для кастома можно использовать statsd
источник

SS

Sergey Sheremeta in Data Engineers
прекрасно работает связка:
org.apache.spark.metrics.sink.StatsdSink (SPARK_HOME/conf/metrics.properties) => statsd-exporter => Prometheus static scraping => Grafana
источник

AG

Alexander Gorokhov in Data Engineers
источник

AK

Alena Korogodova in Data Engineers
...мяу?
источник

b

burzum in Data Engineers
Всем привет, скажите пожалуйста, кто-нибудь использует snowplow?
источник

DZ

Dmitry Zuev in Data Engineers
было дело
источник

b

burzum in Data Engineers
а почему было? не понравилось ? :)
источник

b

burzum in Data Engineers
В общих чертах впечатлениями можете поделиться?
источник

DZ

Dmitry Zuev in Data Engineers
да не, в целом было ок. Но канешн у нас не особо нагрузка была. десятки тысяч уников
источник

DZ

Dmitry Zuev in Data Engineers
глубина не оч большая просмотра
источник

e

er@essbase.ru in Data Engineers
burzum
Всем привет, скажите пожалуйста, кто-нибудь использует snowplow?
А какой кейс применения?
источник

b

burzum in Data Engineers
er@essbase.ru
А какой кейс применения?
Все супер обычно - ecom, трекать мобилки и сайты, грузить все в gbq, витринки делать.
источник