Телеграмм чат группы hadoopusers страница 1720

вообще я редко вижу такое операционное взаимодействие dataproc + bigquery, обычно если используется датапроц, то данные в GCS, а bigquery они грузятся уже когда обработаны; а если все изначально живет в BQ то и датапроц не нужен, все на датафлоу

источник

11:00пожаловаться #7

ПФ

Паша Финкельштейн in Data Engineers

Потому тчо если да - то я могу очевидно датафрейм и из JDBC получить

источник

11:01пожаловаться #8

AZ

Anton Zadorozhniy in Data Engineers

Паша Финкельштейн

А как работает тамошний JDBC кстати? Он поддерживает все эти вайлдкард таблички и так далее?

для BI/Reporting норм, но я не использовал (и не рекомендую) его для массовых выгрузок/загрузок

источник

11:01пожаловаться #9

ПФ

Паша Финкельштейн in Data Engineers

Anton Zadorozhniy

вообще я редко вижу такое операционное взаимодействие dataproc + bigquery, обычно если используется датапроц, то данные в GCS, а bigquery они грузятся уже когда обработаны; а если все изначально живет в BQ то и датапроц не нужен, все на датафлоу

ну у нас примерно так: подрядчики льют стату на BQ, это понятно и им так удобно. Но нам конечно удобно и дешевле свой датапроц делать на spark

источник

11:01пожаловаться #10

AZ

Anton Zadorozhniy in Data Engineers

Паша Финкельштейн

ну у нас примерно так: подрядчики льют стату на BQ, это понятно и им так удобно. Но нам конечно удобно и дешевле свой датапроц делать на spark

вы уверены что дешевле с dataproc чем с dataflow?

источник

11:02пожаловаться #11

ПФ

Паша Финкельштейн in Data Engineers

Anton Zadorozhniy

вы уверены что дешевле с dataproc чем с dataflow?

ну как сказать. Я не то чтобы уверен, но мне по сути бы данные перелить в хайв (кторый всё равно есть и в нём много и из него ничего никуда не уйдёт) и потом их ркутить

источник

11:07пожаловаться #12

AZ

Anton Zadorozhniy in Data Engineers

Паша Финкельштейн

ну как сказать. Я не то чтобы уверен, но мне по сути бы данные перелить в хайв (кторый всё равно есть и в нём много и из него ничего никуда не уйдёт) и потом их ркутить

ну то есть легаси, да, для этого датапроц и затевался

источник

11:08пожаловаться #13

СХ

Старый Хрыч in Data Engineers

😐кстати а пробовал кто в кафке хранить файлы

источник

15:25пожаловаться #14

СХ

Старый Хрыч in Data Engineers

например с расширением mp3

источник