Size: a a a

2020 October 07

Y

Yurgen in Data Engineers
Добрый день, коллеги! Кто-нибудь в курсе почему спарк конектится к кафке не по заданной консьмер групп в настройках а по динамически сгенерированной spark-kafka-source-*. Это баг версии 2.2.0 или фича спарка?
источник

EL

Egor Lebedev in Data Engineers
@sunKazakh сейчас его прохожу, параллельно в тинькове на курсе, вроде актуально всё
источник

R

Roman in Data Engineers
Egor Lebedev
@sunKazakh сейчас его прохожу, параллельно в тинькове на курсе, вроде актуально всё
Спасибо!
источник

K

KrivdaTheTriewe in Data Engineers
Yurgen
Добрый день, коллеги! Кто-нибудь в курсе почему спарк конектится к кафке не по заданной консьмер групп в настройках а по динамически сгенерированной spark-kafka-source-*. Это баг версии 2.2.0 или фича спарка?
Это фича
источник

Y

Yurgen in Data Engineers
А в кафке можно настроить доступ к goupid по wildcard park-kafka-source-*?
источник

P

Pavel in Data Engineers
Используем RocksDB как движок хранения состояний для флинка, всё по мануалам вроде сделано. Упорно не хочет сохранять чекпойнт на S3 если есть обновление стейта (`state.update(...)`)
Сталкивался кто?
источник

OA

Oleksandr Averchenko in Data Engineers
источник
2020 October 08

I

Ilya in Data Engineers
может тут есть боги римоут интепретенга
источник

I

Ilya in Data Engineers
Переслано от Ilya
не, я возился, но все таки следующее не понял как сделать:
у меня через римот интепретер процесс умирает примерно на том же(если на сервере напрямую скрипт прогоняю, все норм) месте обработки посредством kill,
пишет ошибка 137, что связанно обычно с памятью. к тому же проверил torch.cuda.is_available, говорит что нет.
попытался как писали офф. лица из джетбрейна настроить дистрибьтед ран как на картинке, но походу это не то (хз правильно ли сделал, было похоже что да, но процесс все равно умер примерно там же с тем же килом).

Как прогонять через римот интерпритатор с ресурсами, например парой cpu и gpu (как с srun)?
Вот с этим я не разобрался.
источник

I

Ilya in Data Engineers
Ilya
Переслано от Ilya
не, я возился, но все таки следующее не понял как сделать:
у меня через римот интепретер процесс умирает примерно на том же(если на сервере напрямую скрипт прогоняю, все норм) месте обработки посредством kill,
пишет ошибка 137, что связанно обычно с памятью. к тому же проверил torch.cuda.is_available, говорит что нет.
попытался как писали офф. лица из джетбрейна настроить дистрибьтед ран как на картинке, но походу это не то (хз правильно ли сделал, было похоже что да, но процесс все равно умер примерно там же с тем же килом).

Как прогонять через римот интерпритатор с ресурсами, например парой cpu и gpu (как с srun)?
Вот с этим я не разобрался.
а не, памяти одного cpu не хватает, нужны два как минимум.
источник

Ж

Жмака in Data Engineers
Всем привет. Проблема такая- делаю докер имейдж для питоновской аппликации. Требуются джава и другие пакеты как LLVM10. Имейдж использует FROM ubuntu потому что на докерхабе python3-buster не включает нужные os пакеты. В итоге имейдж растет до 4 гига. Есть какой то способ уменьшить размер имейджа?
источник

E

El-Yaz in Data Engineers
Жмака
Всем привет. Проблема такая- делаю докер имейдж для питоновской аппликации. Требуются джава и другие пакеты как LLVM10. Имейдж использует FROM ubuntu потому что на докерхабе python3-buster не включает нужные os пакеты. В итоге имейдж растет до 4 гига. Есть какой то способ уменьшить размер имейджа?
1. джава толстая
2. попробую из пайтон альпайн, а оттуда уже потом доставлять нужные ос пакеты, потому что не факт, что все то, что есть в бустере тебе нужно
источник

Ж

Жмака in Data Engineers
El-Yaz
1. джава толстая
2. попробую из пайтон альпайн, а оттуда уже потом доставлять нужные ос пакеты, потому что не факт, что все то, что есть в бустере тебе нужно
Там нет. Уже посмотрел.
источник

E

El-Yaz in Data Engineers
Жмака
Там нет. Уже посмотрел.
там нет чего?
источник

Ж

Жмака in Data Engineers
El-Yaz
там нет чего?
Llvm 10 например в бустере.
источник

E

El-Yaz in Data Engineers
Жмака
Llvm 10 например в бустере.
ну это понятно. я ж это и сказал. base - apline, а дальше что все нужно sudo apt get -y install
или я тебя неверно понимаю..
источник

AZ

Anton Zadorozhniy in Data Engineers
Жмака
Всем привет. Проблема такая- делаю докер имейдж для питоновской аппликации. Требуются джава и другие пакеты как LLVM10. Имейдж использует FROM ubuntu потому что на докерхабе python3-buster не включает нужные os пакеты. В итоге имейдж растет до 4 гига. Есть какой то способ уменьшить размер имейджа?
надо наоборот делать, брать openjdk образ и тащить туда питон, но маленьким не будет все равно
источник

Ж

Жмака in Data Engineers
Anton Zadorozhniy
надо наоборот делать, брать openjdk образ и тащить туда питон, но маленьким не будет все равно
Насколько большим может быть? Питоновский код все равно запустит джар в контейнере
источник

E

El-Yaz in Data Engineers
Anton Zadorozhniy
надо наоборот делать, брать openjdk образ и тащить туда питон, но маленьким не будет все равно
а чего наоборот, что выиграем? (не оспариваю, скорее вопрос для собственного понимания)
источник

AZ

Anton Zadorozhniy in Data Engineers
Жмака
Насколько большим может быть? Питоновский код все равно запустит джар в контейнере
у меня openjdk8 (511 mb сам по себе) плюс наше барахло (py3, pip jinja2 s3cmd stomp.py teradataml, containerd.io) - 2 гига
источник