Size: a a a

2020 August 31

ИК

Иван Калининский... in Data Engineers
Коллекцию, наверное, надо шафлить, чтобы обеспечить более-менее равномерное использование ресурсов?
источник

K

KrivdaTheTriewe in Data Engineers
Алексей
не пойму как пока дождаться их всех окончания и что будет, если внутри будет эксепшен. Надо попробовать
ну можно обработать)
источник

K

KrivdaTheTriewe in Data Engineers
короче чем глубже в лес
источник

GP

Grigory Pomadchin in Data Engineers
Иван Калининский
Future начинает выполняться сразу после создания? Предположим, что каждый Future запускает Spark job. Как можно ограничить количество одновременно выполняемых джобов?
fixed thread pool
источник

ИК

Иван Калининский... in Data Engineers
Grigory Pomadchin
fixed thread pool
Спасибо!

в cats, как я читал в чате Scala, есть Semaphore, он поможет сделать более умную структуру с пулом, который ограничен не только потоками, но и предельные суммарным весом конкурентных заданий?
источник

K

KrivdaTheTriewe in Data Engineers
Иван Калининский
Спасибо!

в cats, как я читал в чате Scala, есть Semaphore, он поможет сделать более умную структуру с пулом, который ограничен не только потоками, но и предельные суммарным весом конкурентных заданий?
оч много разных реализаций
источник

K

KrivdaTheTriewe in Data Engineers
zio/cats effects/monix
источник

ИК

Иван Калининский... in Data Engineers
KrivdaTheTriewe
оч много разных реализаций
я читал конкурентное программирование в Scala, там действительно много реализаций, даже акторы и реакторы рассматриваются, не говоря уже о JavaRX, и хоть бы что про Cats ((
источник

K

KrivdaTheTriewe in Data Engineers
Иван Калининский
я читал конкурентное программирование в Scala, там действительно много реализаций, даже акторы и реакторы рассматриваются, не говоря уже о JavaRX, и хоть бы что про Cats ((
источник

K

KrivdaTheTriewe in Data Engineers
Иван Калининский
я читал конкурентное программирование в Scala, там действительно много реализаций, даже акторы и реакторы рассматриваются, не говоря уже о JavaRX, и хоть бы что про Cats ((
источник

ИК

Иван Калининский... in Data Engineers
Жмака
В количество данных и последовательное чтение файлов
Благодарен за ссылки, и все же мы отклонились от темы: поможет, если запараллелить чтение файлов, или таки надо думать куда-то ещё ))
источник

Ж

Жмака in Data Engineers
Запустил еще раз с большей памятью для драйвера. С зио совладать не смогу - надо сидеть и изучать. С futures тоже время займёт 😞
источник

AE

Alexey Evdokimov in Data Engineers
исчо раз, задача-то какая? прочитать кластером 25к паркетов на с3?
источник

Ж

Жмака in Data Engineers
Да
источник

AE

Alexey Evdokimov in Data Engineers
ну я её для себя решил вот так (говорил уже):

https://github.com/PastorGL/OneRing/tree/master/DistWrapper
источник

AE

Alexey Evdokimov in Data Engineers
составляю список паркетов, раскидываю по екзекуторм и копирую в хдфс (правда в виде csv)
источник

AE

Alexey Evdokimov in Data Engineers
занимает считанные минуты
источник

K

KrivdaTheTriewe in Data Engineers
на спарке тож самое будет
источник

K

KrivdaTheTriewe in Data Engineers
но ток не колхоз
источник

AE

Alexey Evdokimov in Data Engineers
в смысле колхоз. эт на спарке всё
источник