Телеграмм чат группы hadoopusers страница 1719

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

1724 membersпожаловаться на группу

2019 October 29

ПФ

Паша Финкельштейн in Data Engineers

Anton Zadorozhniy

если речь идет про bigquery views и родной GCP Spark Connector то нет, потому что этот коннектор делает экспорт (раньше в GCS, теперь через Storage API напрямки), а BQ Views не поддерживают экспорт

Я имел в виду всякие виртуальные таблички типа __TABLES_SUMMARY__

источник

10:42пожаловаться #1

ПФ

Паша Финкельштейн in Data Engineers

Я вот не уверен что они прям вьюхи

источник

10:43пожаловаться #2

ПФ

Паша Финкельштейн in Data Engineers

И вайлдкард таблички его тоже не заставишь смотреть, я правильно понял?

источник

10:43пожаловаться #3

ПФ

Паша Финкельштейн in Data Engineers

То есть прямо скажем жалкое подобие левой руки

источник

10:43пожаловаться #4

ПФ

Паша Финкельштейн in Data Engineers

А можно ли заставить его выполнить произвольный sql?

источник

10:44пожаловаться #5

AZ

Anton Zadorozhniy in Data Engineers

ну почему, это рабочая штука, просто для своих задач

источник

10:44пожаловаться #6

AZ

Anton Zadorozhniy in Data Engineers

он ничего не выполняет, это сахар вокруг экспорт джобов, все что вы можете выполнить на данных которые экспортнули в GCS - можно сделать и в BigQuery

источник

10:45пожаловаться #7

ПФ

Паша Финкельштейн in Data Engineers

Anton Zadorozhniy

он ничего не выполняет, это сахар вокруг экспорт джобов, все что вы можете выполнить на данных которые экспортнули в GCS - можно сделать и в BigQuery

Спасибо

источник

10:45пожаловаться #8

ПФ

Паша Финкельштейн in Data Engineers

Мне как-то не хватало этого понимания (и в доке ничего не написано)

источник

10:45пожаловаться #9

AZ

Anton Zadorozhniy in Data Engineers

новый Storage API слава богу научился проекции колонок и какие-то предикаты, но пока доступен в европке только в одном регионе

источник

10:46пожаловаться #10

ПФ

Паша Финкельштейн in Data Engineers

Anton Zadorozhniy

новый Storage API слава богу научился проекции колонок и какие-то предикаты, но пока доступен в европке только в одном регионе

у меня европка!

источник

10:47пожаловаться #11

ПФ

Паша Финкельштейн in Data Engineers

причём кажется даже правильный регион

источник

10:47пожаловаться #12

ПФ

Паша Финкельштейн in Data Engineers

это же тот, который экспериментальный?

источник

10:47пожаловаться #13

ПФ

Паша Финкельштейн in Data Engineers

BQ Storage API

источник

10:48пожаловаться #14

AZ

Anton Zadorozhniy in Data Engineers

Паша Финкельштейн

Мне как-то не хватало этого понимания (и в доке ничего не написано)

чот мне кажется они это не скрывают:
> The connector writes the data to BigQuery by first buffering all the data into a Cloud Storage temporary table, and then it copies all data from into BigQuery in one operation. The connector attempts to delete the temporary files once the BigQuery load operation has succeeded and once again when the Spark application terminates. If the job fails, you may need to manually remove any remaining temporary Cloud Storage files. Typically, you'll find temporary BigQuery exports in gs://bucket/.spark-bigquery-[jobid]-[UUID].

источник

10:48пожаловаться #15

AZ

Anton Zadorozhniy in Data Engineers

Паша Финкельштейн

это же тот, который экспериментальный?

europe-west2

источник

10:48пожаловаться #16

ПФ

Паша Финкельштейн in Data Engineers

Anton Zadorozhniy

чот мне кажется они это не скрывают:
> The connector writes the data to BigQuery by first buffering all the data into a Cloud Storage temporary table, and then it copies all data from into BigQuery in one operation. The connector attempts to delete the temporary files once the BigQuery load operation has succeeded and once again when the Spark application terminates. If the job fails, you may need to manually remove any remaining temporary Cloud Storage files. Typically, you'll find temporary BigQuery exports in gs://bucket/.spark-bigquery-[jobid]-[UUID].

ну как бы вот это совсем не значит что там нельзя выполнить arbitary SQL потому что всегда можно сделать CREATE TABLE FROM SELECT AS (SELECT * FROM ()), а потом её дампануть в gcs

источник

10:49пожаловаться #17

AZ

Anton Zadorozhniy in Data Engineers

Паша Финкельштейн

ну как бы вот это совсем не значит что там нельзя выполнить arbitary SQL потому что всегда можно сделать CREATE TABLE FROM SELECT AS (SELECT * FROM ()), а потом её дампануть в gcs

я понимаю о чем вы, но будь я на месте авторов BQ, я бы тоже пошел по такому пути как они, потому что создание временных структур внутри, оркестрация процессов (надо сделать временную таблицу, выгрузить, а потом удалить, где-то хранить их список) - это много телодвижений, если помнить что для гугла датапроц - это легаси

источник

10:53пожаловаться #18

AZ

Anton Zadorozhniy in Data Engineers

BQ же не совсем СУБД, это скорее Presto на стероидах

источник

10:55пожаловаться #19

ПФ

Паша Финкельштейн in Data Engineers

Anton Zadorozhniy

я понимаю о чем вы, но будь я на месте авторов BQ, я бы тоже пошел по такому пути как они, потому что создание временных структур внутри, оркестрация процессов (надо сделать временную таблицу, выгрузить, а потом удалить, где-то хранить их список) - это много телодвижений, если помнить что для гугла датапроц - это легаси

Но так получается что сабсет дпйствий, который я могу совершить спарком над bq настолько ограничен, что больно.

источник

10:55пожаловаться #20