OMG, это очень неудачное решение, совершенно точно не стоит по такому большому количеству значений партицировать, у вас и partition lookup потом тормозить будет, сжатие пострадает..
Да, я это понимаю, но такова бизнес логика, нужно строить промежуточные структуры типа
Ещё вопрос, как лучше трейсить в спарке(AWS Glue)? Я немного поковырял X-ray, но там нужно устанавливать какой-то сервис, который будет собирать данные и отправлять в x-ray. Непонятно, где он будет крутиться, на драйвере, что ли?
Ещё вопрос, как лучше трейсить в спарке(AWS Glue)? Я немного поковырял X-ray, но там нужно устанавливать какой-то сервис, который будет собирать данные и отправлять в x-ray. Непонятно, где он будет крутиться, на драйвере, что ли?
Ещё вопрос, как лучше трейсить в спарке(AWS Glue)? Я немного поковырял X-ray, но там нужно устанавливать какой-то сервис, который будет собирать данные и отправлять в x-ray. Непонятно, где он будет крутиться, на драйвере, что ли?
Hai guys, I have a question. Can anyone please answer this.
I have an excel file where the columns are dynamic.. Each month they are adding a column.
What would be the best way to upload into sql
I guess, you want to insert it into some table. Well, if you are using DB supporting column families, you can add a column to a family and update it (or the whole family) with new values. If you are using some RDBMS, just use pivot/unpivot, it’s the only rational solution, so you’ll not mess with ddl and dynamic sql every month
Ребят, а расскажите про ограничения в Tableu про объемы данных? Представим себе, есть Greenplum, в нем много-много строк (пара миллиардов, например, на 3-5 колонок) Как себя tableu чувствует с большими данными?
Очень размыто, конечно, спросил, но оч надеюсь, что понятно)))
Ребят, а расскажите про ограничения в Tableu про объемы данных? Представим себе, есть Greenplum, в нем много-много строк (пара миллиардов, например, на 3-5 колонок) Как себя tableu чувствует с большими данными?
Очень размыто, конечно, спросил, но оч надеюсь, что понятно)))