Телеграмм чат группы hadoopusers страница 2879

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2007 membersпожаловаться на группу

2020 October 16

A

Alex in Data Engineers

например если данные нужно по разным стейджам перегонять в пределах одного Redshift - dbt хороший кандидат для этого?

источник

16:43пожаловаться #1

A

Alex in Data Engineers

тоесть смысл dbt в том, что она берет на себя всю рутину по созданию таблиц и вьюх а инженер фокусируется только на бизнес логике трансформаций которую описывает чередой селектов?

источник

17:07пожаловаться #2

А

Алексей in Data Engineers

подскажите, если через spark.jdbc запущена долгая выгрузка в 1 сессию, то где можно посмотреть, сколько уже скачалось? Может в hdfs tmp целевой таблицы где то файл создается?

вот если я хочу разобраться в какой то части спарка (https://github.com/apache/spark), а ответа в гугле не нахожу. Как мне сориентировать в исходниках спарка, чтобы посмотреть это там? К примеру, как тут, интересует часть, где происходит запись данных из jdbc

источник

17:11пожаловаться #3

N

Nikita Blagodarnyy in Data Engineers

подскажите, если через spark.jdbc запущена долгая выгрузка в 1 сессию, то где можно посмотреть, сколько уже скачалось? Может в hdfs tmp целевой таблицы где то файл создается?

в хистори сервере.

источник

17:48пожаловаться #4

А

Алексей in Data Engineers

Nikita Blagodarnyy

в хистори сервере.

это в spark application ui? у меня там показывается объем и число строк, только после завершение, но не во время работы

источник

17:50пожаловаться #5

SS

Sergey Sheremeta in Data Engineers

вот если я хочу разобраться в какой то части спарка (https://github.com/apache/spark), а ответа в гугле не нахожу. Как мне сориентировать в исходниках спарка, чтобы посмотреть это там? К примеру, как тут, интересует часть, где происходит запись данных из jdbc

склонировать github-репозитории себе.
открыть репозиторий в Idea.
сделать чекаут интересующей версии/тега
прошаривать код
(опционально прошаривать Scala)

источник

21:48пожаловаться #6

ME

Max Efremov in Data Engineers

Sergey Sheremeta

склонировать github-репозитории себе.
открыть репозиторий в Idea.
сделать чекаут интересующей версии/тега
прошаривать код
(опционально прошаривать Scala)

Можно прям на гитхабе даже

источник

21:50пожаловаться #7

А

Алексей in Data Engineers

Sergey Sheremeta

склонировать github-репозитории себе.
открыть репозиторий в Idea.
сделать чекаут интересующей версии/тега
прошаривать код
(опционально прошаривать Scala)

А как понять в который файл смотреть, если нет эксепшена с именем класса?

источник

21:50пожаловаться #8

А

Алексей in Data Engineers

Стек трейс чтоли во время работы снимать?

источник

21:51пожаловаться #9

SS

Sergey Sheremeta in Data Engineers

Можно прям на гитхабе даже

а как без Control-B быстро бегать между классами/методами?

источник

21:51пожаловаться #10

ME

Max Efremov in Data Engineers

Sergey Sheremeta

а как без Control-B быстро бегать между классами/методами?

Мышкой тыкать файлики))

источник

21:51пожаловаться #11

SS

Sergey Sheremeta in Data Engineers

А как понять в который файл смотреть, если нет эксепшена с именем класса?

сделайте сами эксепшон - пишите в несуществующую таблицу, предварительно выставив
sc.setLogLevel("DEBUG")

источник

21:52пожаловаться #12

SS

Sergey Sheremeta in Data Engineers

и я очень советую прошаривать спрак через его тесты

источник

21:53пожаловаться #13

А

Алексей in Data Engineers

Sergey Sheremeta

и я очень советую прошаривать спрак через его тесты

Это как? Не очень понял

источник

21:54пожаловаться #14

GP

Grigory Pomadchin in Data Engineers

вот если я хочу разобраться в какой то части спарка (https://github.com/apache/spark), а ответа в гугле не нахожу. Как мне сориентировать в исходниках спарка, чтобы посмотреть это там? К примеру, как тут, интересует часть, где происходит запись данных из jdbc

интуиция по ключевым словам

источник

21:56пожаловаться #15

GP

Grigory Pomadchin in Data Engineers

источник

21:56пожаловаться #16

SS

Sergey Sheremeta in Data Engineers

Это как? Не очень понял

да я сам залетный тут, просто читал как "отцы" говорили по тестам изучать функциональность

источник

21:58пожаловаться #17

А

Алексей in Data Engineers

Спасиб, в общем понял, что серебряной пули нет

источник

22:01пожаловаться #18

GP

Grigory Pomadchin in Data Engineers

нету ни для какого проекта

источник

22:03пожаловаться #19

АЖ

Андрей Жуков... in Data Engineers

да и в жизни

источник

22:05пожаловаться #20