Size: a a a

2020 October 13

T

T in Data Engineers
Dmitry Zuev
Монорепа
+1
источник

А

Алексей in Data Engineers
а что сломалось у хайва? чтоб нам тоже не напороться
источник

A

Anton Kovalenko in Data Engineers
Uncel Duk
А кто-то имел опыт поддержки своего форка хайва например
Написал в личку
источник

DZ

Dmitry Zuev in Data Engineers
Anton Kovalenko
Написал в личку
Что ж вы так
источник

DZ

Dmitry Zuev in Data Engineers
Нас тоже интересно
источник

UD

Uncel Duk in Data Engineers
Сек
источник

UD

Uncel Duk in Data Engineers
источник

UD

Uncel Duk in Data Engineers
diff --git ql/src/java/org/apache/hadoop/hive/ql/exec/tez/TezSessionState.java ql/src/java/org/apache/hadoop/hive/ql/exec/tez/TezSessionState.java
index e8a1757..8870049 100644
--- ql/src/java/org/apache/hadoop/hive/ql/exec/tez/TezSessionState.java
+++ ql/src/java/org/apache/hadoop/hive/ql/exec/tez/TezSessionState.java
@@ -400,10 +400,6 @@ private TezClient startSessionAndContainers(TezClient session, HiveConf conf,
      // TezSessionPoolManager sets tez.queue.name if user has specified one or use the one from
      // cluster wide queue names.
      // There is no way to differentiate how this was set (user vs system).
-      // Unset this after opening the session so that reopening of session uses the correct queue
-      // names i.e, if client has not died and if the user has explicitly set a queue name
-      // then reopened session will use user specified queue name else default cluster queue names.
-      conf.unset(TezConfiguration.TEZ_QUEUE_NAME);
      return session;
    } finally {
      if (isOnThread && !isSuccessful) {
источник

UD

Uncel Duk in Data Engineers
В итоге пишется памятка, где такие приколы описаны и доморощенные костыли
источник

UD

Uncel Duk in Data Engineers
в одно лицо запатчить все можно конечно на радость автобусу =)
источник

AA

Ali Abdullaev in Data Engineers
Anton Zadorozhniy
нет, iceberg/hudi/delta это скорее hive acid done right; orc/parquet это форматы хранения, они продолжают использоваться вместе с iceberg/hudi/delta
жаль, я бы послушал про примеры внедрения айсберга и насколько это улучшило ситуацию
источник

AZ

Anton Zadorozhniy in Data Engineers
Ali Abdullaev
жаль, я бы послушал про примеры внедрения айсберга и насколько это улучшило ситуацию
следите за этой темой, там много всего происходит
источник

АЖ

Андрей Жуков... in Data Engineers
iceberg прям пушка по концепции, я все хожу и облизываюсь
источник

MA

Mark Andreev in Data Engineers
Ali Abdullaev
жаль, я бы послушал про примеры внедрения айсберга и насколько это улучшило ситуацию
Так он же "Iceberg is under active development at the Apache Software Foundation.".

Правильно я понимаю, что еще рано пользоваться?
источник

N

Nikita Blagodarnyy in Data Engineers
Mark Andreev
Так он же "Iceberg is under active development at the Apache Software Foundation.".

Правильно я понимаю, что еще рано пользоваться?
Есть дурацкие баги. Ну типа отказывается писать df, пока не отсортируешь его. Это начинает отжирать килотонну ресурсов на сортировку.
источник

N

Nikita Blagodarnyy in Data Engineers
Во втором спарке запись позиционная-по именам отдуплить не умеет. Пришлось писать обмазывание схемой.
источник

AZ

Anton Zadorozhniy in Data Engineers
Mark Andreev
Так он же "Iceberg is under active development at the Apache Software Foundation.".

Правильно я понимаю, что еще рано пользоваться?
смотря какие у вас ожидания, и что нужно.. просто чтобы попробовать тащить в продакшен наверное не стоит
источник

N

Nikita Blagodarnyy in Data Engineers
Недавно он начал считать, что его колонка long, хотя таблица создавалась Types.NestedField.optional(2 , "update_ts" , Types.TimestampType.withZone())
источник

N

Nikita Blagodarnyy in Data Engineers
В схеме df тоже timestamp
источник

N

Nikita Blagodarnyy in Data Engineers
скастовал в int-прожевал. почему так-хз.
источник