Size: a a a

2020 September 15

DZ

Dmitry Zuev in Data Engineers
Alexey Evdokimov
кто-нить знает альтернативу apache poi?

а то вот понадобилось репорт в ексельник завернуть, но смотрю я на xssf и просто охуеваю. оно явно жопой написано, баг на баге и вообще полный трэш
Был скала дсл кстати
источник

DZ

Dmitry Zuev in Data Engineers
На 3, но в целом ок
источник

AE

Alexey Evdokimov in Data Engineers
мде
источник

AE

Alexey Evdokimov in Data Engineers
два дня потратил чтобы заставить пои корректно сохранять в хмл. у них там flush в паре мест тупо забыт, из-за этого сохраняет битый зип
источник

AE

Alexey Evdokimov in Data Engineers
ну вот как так можно, вообще непонятно
источник

AE

Alexey Evdokimov in Data Engineers
самое смешное, что вызвать из публичного апи этот самый flush нельзя. приходится сохранять копию документа во временный файл (который получается битым), и потом его удалять. и тогда "настоящий" открытый документ сохраняется нормально. а, ну ещё формулы съезжают при вставке строк, но это по ходу давно известный баг, который никто не фиксит
источник

AE

Alexey Evdokimov in Data Engineers
некоторые широко известные опенсорсные либы откровенно вымораживают своим качеством
источник

E

Evgeny in Data Engineers
Это ж опенсорс: каждый может внести свой вклад поправил и написав тесты ;)
источник

AE

Alexey Evdokimov in Data Engineers
время деньги. если проект не спонсирует какой-нить ибм, то это такой вот себе опенсорс :(
источник

E

Evgeny in Data Engineers
Ну так и контрибьють, и будет опенсорс лучше
источник

M

Mi in Data Engineers
Коллеги, есть ли в спарке в dataset api аналог cogroup который позволяет дальше работать с датасетами, а не итераторами?
источник

M

Mi in Data Engineers
уж больно большие итераторы получаются
источник

DZ

Dmitry Zuev in Data Engineers
Mi
Коллеги, есть ли в спарке в dataset api аналог cogroup который позволяет дальше работать с датасетами, а не итераторами?
Яннп
источник

M

Mi in Data Engineers
Dmitry Zuev
Яннп
Все методы у KeyGroupedDataset так или иначе работают с итераторами внутри этих групп, мне бы хотелось как-то вместо итераторов продолжить работать с датасетами чтобы лучше параллелилось
источник

DZ

Dmitry Zuev in Data Engineers
Если вы про KeyValueGroupedDataset то напрямую с ним не надо работать. В доке ж даже написано
источник

DZ

Dmitry Zuev in Data Engineers
Mi
уж больно большие итераторы получаются
Может тогда стоит другой ключ выбрать?
источник

M

Mi in Data Engineers
Dmitry Zuev
Может тогда стоит другой ключ выбрать?
Там по логике не подходит, буду думать
источник
2020 September 16

D

Dasha in Data Engineers
источник

D

Dasha in Data Engineers
Коллеги, можете, пожалуйста, помочь с AirFlow разобраться?

Не работает вкладка дагов

Настройки:

postgres=# create database airflow_metadata;
CREATE DATABASE
postgres=# CREATE USER airflow WITH password 'airflow';
CREATE ROLE
postgres=# grant all privileges on database airflow_metadata to airflow;
GRANT

$ grep sql_alchemy_conn /home/ubuntu/git/airflow/airflow.cfg
sql_alchemy_conn = postgresql+psycopg2://airflow:airflow@localhost/airflow_metadata

$ grep load_examples /home/ubuntu/git/airflow/airflow.cfg
load_examples = False
источник

IB

Ivan Bruzgin in Data Engineers
Так а scheduler то точно запущен?
источник