Size: a a a

2020 December 17

NN

No Name in Data Engineers
А для спарка то же самое не изучали?
источник

А

Алексей in Data Engineers
No Name
А для спарка то же самое не изучали?
подробно так не смотрел, но по доке датабрикса это все есть в spark 3.0 + delta
источник

神風 in Data Engineers
Всем привет. Подскажите, камрады, а есть тулзы для проверки авро схем на предмет соответствия спецификации?
источник

N

Nikita Blagodarnyy in Data Engineers
神風
Всем привет. Подскажите, камрады, а есть тулзы для проверки авро схем на предмет соответствия спецификации?
schema registry.
источник

神風 in Data Engineers
Nikita Blagodarnyy
schema registry.
Ну засчитывается) спасибо. А что-то более удобное?
источник

N

Nikita Blagodarnyy in Data Engineers
источник

神風 in Data Engineers
@nblagodarnyy спасибо большое!
источник

SK

Sergey Kaurov in Data Engineers
Привет 👋
источник

SK

Sergey Kaurov in Data Engineers
Спрашивал вчера в группе про режимы hadoop. Пытаюсь выставть Fire Sheduler и чёт на хочет
источник

SK

Sergey Kaurov in Data Engineers
В Spark как был FIFO так и остался..
источник

SK

Sergey Kaurov in Data Engineers
В yarn-saite.xml прописал пару строк из документации Arenadata (перевод 📄 доки apache) 🙄 остальное вроде как по умолчанию берётся, но Spark говорит про  FIFO.
источник

SK

Sergey Kaurov in Data Engineers
Что-то не доделал? Просто в 📄 документации включение так описано..
источник

ab

a b in Data Engineers
Code requests*?
источник

N

Nikita Blagodarnyy in Data Engineers
Граждане-мавеноводы, помогите разобраться.
Есть мультимодуль проект

Родитель
<groupId>my.group</groupId>
<artifactId>datalake-airflow-etl</artifactId>
<packaging>pom</packaging>
<version>${revision}</version>
<modules>
 <module>common</module>
 <module>common-test</module>
</modules>


Чайлд 1
<parent>
   <artifactId>datalake-airflow-etl</artifactId>
   <groupId>
my.group</groupId>
   <version>${revision}</version>
</parent>
<modelVersion>4.0.0</modelVersion>

<groupId>
my.group</groupId>
<artifactId>datalake-common-test</artifactId>
<name>datalake-common-test</name>
<version>${revision}</version>

<депы> всякие cкалатесты и мокито из централа </депы>

Чайлд 2, ссылается на 1
<parent>
 <groupId>
my.group</groupId>
 <artifactId>datalake-airflow-etl</artifactId>
 <version>${revision}</version>
</parent>

<artifactId>datalake-common</artifactId>
<name>datalake-common</name>

<dependencies>
 <dependency>
   <groupId>
my.group</groupId>
   <artifactId>datalake-common-test</artifactId>
   <version>${project.version}</version>
   <scope>test</scope>
 </dependency>
</dependencies>




Проблема в том, что первый билдится нормально, а второй нет, валится с ошибкой, что не может найти в нексусе пом-родителя
Could not find artifact my.group:datalake-airflow-etl:pom:0.0.1-SNAPSHOT in java-dev-team
источник

N

Nikita Blagodarnyy in Data Engineers
Или я слишком много от него хочу и билдиться будет только весь проект целиком, а отдельные модули со ссылками друг на друга-нет?
источник

N

Nikita Blagodarnyy in Data Engineers
Если из чайлда_2 убрать депенденси чайлд_1, то все отлично тож.
источник

AE

Alexey Evdokimov in Data Engineers
если сделаешь mvn install, будут и по отдельности собираться
источник

N

Nikita Blagodarnyy in Data Engineers
ну вот один инсталлится, второй зависимый зачем-то в нексус идет за родительским помом.
источник

AE

Alexey Evdokimov in Data Engineers
install начиная с родительского
источник

AE

Alexey Evdokimov in Data Engineers
т.е. хотя бы один раз mvn install в родителе. закешируется, не будет в нексус ходить
источник