вообще я редко вижу такое операционное взаимодействие dataproc + bigquery, обычно если используется датапроц, то данные в GCS, а bigquery они грузятся уже когда обработаны; а если все изначально живет в BQ то и датапроц не нужен, все на датафлоу
вообще я редко вижу такое операционное взаимодействие dataproc + bigquery, обычно если используется датапроц, то данные в GCS, а bigquery они грузятся уже когда обработаны; а если все изначально живет в BQ то и датапроц не нужен, все на датафлоу
ну у нас примерно так: подрядчики льют стату на BQ, это понятно и им так удобно. Но нам конечно удобно и дешевле свой датапроц делать на spark
ну как сказать. Я не то чтобы уверен, но мне по сути бы данные перелить в хайв (кторый всё равно есть и в нём много и из него ничего никуда не уйдёт) и потом их ркутить
ну как сказать. Я не то чтобы уверен, но мне по сути бы данные перелить в хайв (кторый всё равно есть и в нём много и из него ничего никуда не уйдёт) и потом их ркутить
ну то есть легаси, да, для этого датапроц и затевался