Size: a a a

2020 August 31

Ж

Жмака in Data Engineers
KrivdaTheTriewe
он для этого предназначен
Я его не знаю. Надо читать, тестить. Много времени уйдет, а результат нужен завтра)
источник

K

KrivdaTheTriewe in Data Engineers
Жмака
Я его не знаю. Надо читать, тестить. Много времени уйдет, а результат нужен завтра)
я пример вам прислал
источник

K

KrivdaTheTriewe in Data Engineers
уйдет на все не больше 3-5 часов
источник

А

Алексей in Data Engineers
как тогда дождаться выполнения всех future в массиве?
источник

А

Алексей in Data Engineers
val result = Future.sequence(futures)
result.onComplete - так?
источник

Ж

Жмака in Data Engineers
KrivdaTheTriewe
import zio._
import zio.blocking.Blocking
def execute(path:String) = blocking.effectBlocking {
spark.read.parquet(path)
}
val load = paths.map(x => execute(x))
   ZIO.collectAllPar(load).map(x => x.reduce(_.union(_)))
Какой это артифакт в мавен? Их тут много
источник

K

KrivdaTheTriewe in Data Engineers
Жмака
Какой это артифакт в мавен? Их тут много
используйте Future
источник

K

KrivdaTheTriewe in Data Engineers
Алексей
val result = Future.sequence(futures)
result.onComplete - так?
.sequence приведет List[Future] к Future[List]
источник

K

KrivdaTheTriewe in Data Engineers
и дальше можно Awaits сделать
источник

Ж

Жмака in Data Engineers
KrivdaTheTriewe
используйте Future
А с zio не стоит пробовать?
источник

K

KrivdaTheTriewe in Data Engineers
я думаю вам не хватит вермени
источник

K

KrivdaTheTriewe in Data Engineers
если нужно за 2 -3 часа
источник

ИК

Иван Калининский... in Data Engineers
KrivdaTheTriewe
почему вы не хотите Future использовать?
Future начинает выполняться сразу после создания? Предположим, что каждый Future запускает Spark job. Как можно ограничить количество одновременно выполняемых джобов?
источник

K

KrivdaTheTriewe in Data Engineers
Иван Калининский
Future начинает выполняться сразу после создания? Предположим, что каждый Future запускает Spark job. Как можно ограничить количество одновременно выполняемых джобов?
экзекушон контекстом
источник

K

KrivdaTheTriewe in Data Engineers
или использовать более продвинутые техники
источник

K

KrivdaTheTriewe in Data Engineers
типа cats effect, zio
источник

K

KrivdaTheTriewe in Data Engineers
там больше контроля и больше всяких удобных плюшек для контроля IO кода
источник

А

Алексей in Data Engineers
Иван Калининский
Future начинает выполняться сразу после создания? Предположим, что каждый Future запускает Spark job. Как можно ограничить количество одновременно выполняемых джобов?
implicit val ec = ExecutionContext.fromExecutorService(Executors.newWorkStealingPool(12))
источник

ИК

Иван Калининский... in Data Engineers
Спасибо
источник

А

Алексей in Data Engineers
не пойму как пока дождаться их всех окончания и что будет, если внутри будет эксепшен. Надо попробовать
источник