Size: a a a

2020 August 13

GP

Grigory Pomadchin in Data Engineers
Andrey Sutugin
Да мне надо тупо финансовому директору предоставить список контор, кто может, что бы я для компании не стал пресловутым bus factor-ом, что-то в моей конторе не верят, что можно легко найти контору на аутсорс хадуповского зоопарка
давай лучше в data jobs; слишком много полеимки будет
источник

AS

Andrey Sutugin in Data Engineers
Anton Kovalenko
Ну да, это совсем другое )
как правильно это назвать, а то я с терминологией слабоват
источник

AS

Andrey Sutugin in Data Engineers
Grigory Pomadchin
давай лучше в data jobs; слишком много полеимки будет
ок, сорян
источник

N

Nikita Blagodarnyy in Data Engineers
Grigory Pomadchin
давай лучше в data jobs; слишком много полеимки будет
форкнулись уже туда
источник

A

Anton Kovalenko in Data Engineers
Andrey Sutugin
Наверное я не правильно сформулировал, не аутсорс хадупа,  а создание etl для загрузки данных в hdfs/hive из различных источников РСУБД(mssql/postgres/mysql/etc)/bigquery/какие-то абстрактные crm
ДИСы например на etl собаку съели, но на Информатике. Ну и многие интеграторы в этом шарят
источник
2020 August 14

AM

Al Mi in Data Engineers
Aleksey
Линки делаете между каждым хабом (если есть FK связь между ними). Дальше уже начинается вопрос с оптимизацией: если пол - это вовсе не справочник (т.е. его нет как отдельной бизнес сущности), то зачем хаб для него - можно и в сателлит положить.
Админы, книжку по волту тут можно выложить?
источник

GP

Grigory Pomadchin in Data Engineers
Al Mi
Админы, книжку по волту тут можно выложить?
конечно же версию для ознакомления?
источник

N

Nikita Blagodarnyy in Data Engineers
может он[а] сам[a] написал[a]
источник

AM

Al Mi in Data Engineers
Grigory Pomadchin
конечно же версию для ознакомления?
Естественно, после ознакомления уничтожить
источник

GP

Grigory Pomadchin in Data Engineers
Al Mi
Естественно, после ознакомления уничтожить
или купить версию у автора; можно конечно выкладывать сюда
источник

SS

Sergey Sheremeta in Data Engineers
Al Mi
Админы, книжку по волту тут можно выложить?
а можно в личку? что за книжка-то? от дяди Дэна?
источник

GP

Grigory Pomadchin in Data Engineers
можно и не в личку*
источник

AM

Al Mi in Data Engineers
Не могу найти, от дэна да, подключу винт через час
источник

AM

Al Mi in Data Engineers
Emailing Building_a_Scalable_Data_Warehouse_With_Data_Vault_2.0.pdf
источник

SS

Sergey Sheremeta in Data Engineers
источник

VA

Vladislav Akatov in Data Engineers
В Airflow использую FTPHook, BashOperator за несколько секунд падает по таймауту при извлечении файла с данными:
airflow.exceptions.AirflowTaskTimeout: Timeout

При этом для самого BashOperator в определении DAGа увеличил
execution_timeout
до десяти минут - не работает. Никто не ел такое?
источник

S

Stanislav in Data Engineers
Vladislav Akatov
В Airflow использую FTPHook, BashOperator за несколько секунд падает по таймауту при извлечении файла с данными:
airflow.exceptions.AirflowTaskTimeout: Timeout

При этом для самого BashOperator в определении DAGа увеличил
execution_timeout
до десяти минут - не работает. Никто не ел такое?
источник

S

Stanislav in Data Engineers
брр
источник

AK

Andrew Konstantinov in Data Engineers
Привет!Что кто использует в качестве feature storage для мл ?
источник

DZ

Dmitry Zuev in Data Engineers
Andrew Konstantinov
Привет!Что кто использует в качестве feature storage для мл ?
Hdfs
источник