Size: a a a

2020 January 27

АП

Артем Прытков... in Чат Tableau
Roman Voronov
Будет экстракт, пока не решил от чего.
если будет экстракт, то тебе по барабану какой исходник (не считая скорости создания экстракта, конечно)😎
источник

RV

Roman Voronov in Чат Tableau
Артем Прытков
если будет экстракт, то тебе по барабану какой исходник (не считая скорости создания экстракта, конечно)😎
Супер! А что по разумному размеру таблицы? Есть верхний предел разумной производительности?
источник

RV

Roman Voronov in Чат Tableau
Выбираю между вертикальной и горизонтальной таблицей.
источник

АП

Артем Прытков... in Чат Tableau
нуу, сильно зависит от сложности  вычислений. Если тупо сумма и группировка по паре полей, то 200 миллионов потянет. В целом, горизонтальная таблица содержит предрасчитанные значения, что хорошо для скорости, вертикальная даёт большую гибкость. Баланс как всегда ищешь сам
источник

AV

Alexander Varlamov in Чат Tableau
У БД еще есть ограничения на объем данных, которые забираются для экстракта. У Редшифта это 192Gb, 300+млн строк и 20-25 полей примерно (половина текстовых). Лимит можно увеличить, но нагрузку надо смотреть на базу - можно в память упереться
источник

АП

Артем Прытков... in Чат Tableau
192гб сырых данных это уже немножко перебор... сколько они выгружаться будут? ))
источник

AV

Alexander Varlamov in Чат Tableau
Сам экстракт меньше 10Гб. Выгружались около 1,5 часа
источник

JF

Jack Finch in Чат Tableau
Добрый день, как я могу при джоине получать только первую строку соответствующую условию объединения?
источник

OK

Olga Kolcheva in Чат Tableau
Jack Finch
Добрый день, как я могу при джоине получать только первую строку соответствующую условию объединения?
Зависит от того почему у вас строки дублируются
источник

JF

Jack Finch in Чат Tableau
Olga Kolcheva
Зависит от того почему у вас строки дублируются
Соединяю письма с событиями по юзер айди. Задача посчитать пользователей у которых произошло событие в течении 72 часов после взаимодействия с письмом. Соединяемые таблички в postgres, но в разных БД
источник

OK

Olga Kolcheva in Чат Tableau
А почему просто Count distinct не сделать по id?
источник

JF

Jack Finch in Чат Tableau
Olga Kolcheva
А почему просто Count distinct не сделать по id?
Не совсем понимаю. Дистинкт со стороны событий по пользователям и на него считать первое событие? Оно тогда может не вписаться в рамки 72 часов после письма, хотя последующие события могли бы.
источник

OK

Olga Kolcheva in Чат Tableau
Jack Finch
Не совсем понимаю. Дистинкт со стороны событий по пользователям и на него считать первое событие? Оно тогда может не вписаться в рамки 72 часов после письма, хотя последующие события могли бы.
Если только первое событие нужно, можно просто в SQL все это пронумеровать, если синтаксис базы позволяет и взять только первое
источник

JF

Jack Finch in Чат Tableau
if [action] = "clicked" or [action] = "opened" THEN [user_id] END = user_id_events
if [action] = "clicked" or [action] = "opened" THEN [created_at (email_stat)] END <= DATEADD('second',[event_time],#1970-01-01#)
if [action] = "clicked" or [action] = "opened" THEN DATEADD('hour',72,[created_at (email_stat)]) END >= DATEADD('second',[event_time],#1970-01-01#)
источник

JF

Jack Finch in Чат Tableau
условия моего обьединения
источник

JF

Jack Finch in Чат Tableau
Olga Kolcheva
Если только первое событие нужно, можно просто в SQL все это пронумеровать, если синтаксис базы позволяет и взять только первое
Проблема в том что условия про 72 часа пробрасывается между разными БД
источник

JF

Jack Finch in Чат Tableau
и еще вопрос)
Можно как-то настраивать тултип для каждой меры в отдельности, когда measure values на полке rows, на полке columns даты, а measure names на цвете ?
источник

ПП

Павел Петров... in Чат Tableau
Всем здравствуйте. Помогите новичку в Табло. Что дают эти скобки в мерах? Почему при их отсутствии меру нельзя перенести в дайменшонс, а с ними можно? В чем их смысл...
источник

ПП

Павел Петров... in Чат Tableau
источник

ПП

Павел Петров... in Чат Tableau
источник