Size: a a a

2019 November 27

AE

Alexey Evdokimov in Data Engineers
я прям щас пилю такую систему. получается энтерпрайзненько и довольно кроваво. вот думаю, не изобретаю ли велосипед.
источник

AE

Alexey Evdokimov in Data Engineers
каждый квадратик тут по сути наследник
   public abstract class Operation implements Serializable {
       public abstract Map<String, JavaRDDLike> getResult(Map<String, JavaRDDLike> input);
   }
источник

AS

Andrey Sutugin in Data Engineers
Alexey Evdokimov
я прям щас пилю такую систему. получается энтерпрайзненько и довольно кроваво. вот думаю, не изобретаю ли велосипед.
Есть такая штука(https://github.com/YotpoLtd/metorikku), только без гуя вроде, но сам не пользовался, пилю свои велосипеды)))
источник

K

KrivdaTheTriewe in Data Engineers
Alexey Evdokimov
каждый квадратик тут по сути наследник
   public abstract class Operation implements Serializable {
       public abstract Map<String, JavaRDDLike> getResult(Map<String, JavaRDDLike> input);
   }
А чего вы не на скале пишите ?
источник

AE

Alexey Evdokimov in Data Engineers
ну он может быть и на скале, мне всё равно. остальная обвязка на жабе, потому что так проще
источник

AE

Alexey Evdokimov in Data Engineers
гуй у меня в отдалённых планах на самом-то деле. щас пока весь пайплайн через километровые конфиги, собираемые при помощи такой-то матери и набора разрозненных инструментов
источник

AE

Alexey Evdokimov in Data Engineers
после нового года может быть и на гитхаб выложу.
правда, без квадратиков с патентованными алгоритмами их не очень много будет
источник

K

KrivdaTheTriewe in Data Engineers
У меня один вопрос
источник

K

KrivdaTheTriewe in Data Engineers
А почему нельзя нарисовать план физический ?
источник

K

KrivdaTheTriewe in Data Engineers
И скрины каталиста
источник

AE

Alexey Evdokimov in Data Engineers
план чего?
источник

K

KrivdaTheTriewe in Data Engineers
какой-то такой lo-fi concept:
источник

AE

Alexey Evdokimov in Data Engineers
это концепт гуя для редактирования процесса, составляемого из набора операций, написанных на жабе/скале, каждая из которых берёт на вход некие датасеты, и генерирует некие датасеты по заданным правилам. операций около 50, а процессов из них на данный момент нужно составлять несколько сотен.
источник

AE

Alexey Evdokimov in Data Engineers
некоторые процессы повторяются часто, для сотен исходных датасетов. некоторые уникальные. рисуются под одного заказчика и считаются один раз
источник

AE

Alexey Evdokimov in Data Engineers
а мне это надо автоматизировать, что бы не было так, блин, больно, как сейчас...
источник

K

KrivdaTheTriewe in Data Engineers
Все это было обречено на провал
источник

K

KrivdaTheTriewe in Data Engineers
Все такие гуи
источник

K

KrivdaTheTriewe in Data Engineers
Так мне кажется можно пойти по пути генерации sql
источник

K

KrivdaTheTriewe in Data Engineers
Есть наверняка же какие то гуи
источник

AE

Alexey Evdokimov in Data Engineers
у каждого модуля от запуска к запуску набор настроек отличается, входные данные тоже в каком попало формате.
в итоге у меня несколько DSL на конфигурацию и для описания входа (хорошо, если формат колоночный, но может быть и набор полигонов из OSM)
источник