Телеграмм чат группы data_architect страница 82

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Архитектура данных

314 membersпожаловаться на группу

1
«
…
‹
77
78
79
80
81
82
83
›
…
»

2019 December 04

A

Alexey in Архитектура данных

Надо конечно проверить как он будет себя чувствовать в таком кейсе. В части аналитики понятное дело - отлично, но тащить по одной записи и постоянно - хз. Как проверю - отпишусь.

источник

11:38пожаловаться #1

A

Alexey in Архитектура данных

Ну все зависит от основных запросов все таки

Получение метрик по идентификатору устройств и фильтрация по нескольким колонкам.

источник

11:40пожаловаться #2

A

Alexey in Архитектура данных

Кх просто для пейджинга использовать плохая идея, это в кейсе с фильтрацией я имею ввиду.

источник

11:41пожаловаться #3

OP

O. Petr in Архитектура данных

В гринпламе сегментировать по id устройств , партицнуть по времени, будете брать с каждого сегмента по последним данным из партиции

источник

11:41пожаловаться #4

Д

Дмитрий in Архитектура данных

Кх просто для пейджинга использовать плохая идея, это в кейсе с фильтрацией я имею ввиду.

RIAK TS посмотрите еще

источник

11:42пожаловаться #5

Д

Дмитрий in Архитектура данных

тоже тайм сериз

источник

11:42пожаловаться #6

A

Alexey in Архитектура данных

А как-то чистить в ts можно данные автоматически? что-то вроде того как в КХ движок ReplacingMergeTree делает, где по факту на диске спустя какое-то время хранится один экземпляр строки.

источник

11:46пожаловаться #7

Д

Дмитрий in Архитектура данных

А как-то чистить в ts можно данные автоматически? что-то вроде того как в КХ движок ReplacingMergeTree делает, где по факту на диске спустя какое-то время хранится один экземпляр строки.

у influx есть ретеншн полиси

источник

11:47пожаловаться #8

Д

Дмитрий in Архитектура данных

https://docs.influxdata.com/influxdb/v1.7/guides/downsampling_and_retention/

Downsampling and data retention | InfluxData Documentation

источник

11:47пожаловаться #9

A

Alexey in Архитектура данных

у influx есть ретеншн полиси

Спасибо

источник

11:48пожаловаться #10

Д

Дмитрий in Архитектура данных

и у риака вот https://riak.com/products/riak-ts/global-object-expiration/index.html?p=12165.html

Global Object Expiration

источник

11:49пожаловаться #11

K

Kirill M in Архитектура данных

Ещё можно timescale посмотреть. Это PG переделанная под TS

источник

12:13пожаловаться #12

K

Kirill M in Архитектура данных

Под time series

источник

12:14пожаловаться #13

PD

Phil Delgyado in Архитектура данных

Всем привет. Подскажите, что можно использовать для персистентного хранения актуальных данных? Каждую секунду может приходить несколько десятков тысяч метрик от устройств. Требуется в любой момент времени получать последнюю метрику по какому-то конкретному устройству. Pg сейчас используется для этого, но для этой задачи от не очень походит.

Kafka + inmem + pg?

источник

13:06пожаловаться #14

PD

Phil Delgyado in Архитектура данных

А какие требования к надёжности?

источник

13:08пожаловаться #15

A

Alexey in Архитектура данных

Kafka + inmem + pg?

проблема с pg в автовакуме, мы сейчас пишем в несколько таблиц метричных в pg, потом раз в какое-то время фоновый процесс вычищает все, кроме последней метрики по каждому устройству.

источник

13:53пожаловаться #16

PD

Phil Delgyado in Архитектура данных

Это понятно, но в такой схеме pg нужен только как "бэкап" и время на автовакум не существенно.
Т.е. кафку читаем и пишем в банальную inmem key-value (взять готовый редис или просто написать hash-map).
И аггрегируеем пачками и пишем в PG.
При падении - забираем актуальное из PG+kafka (и это самое сложное).

источник

13:55пожаловаться #17

A

Alexey in Архитектура данных

kafka чтобы что? чтобы не положить редис?

источник

13:57пожаловаться #18

A

Alexey in Архитектура данных

> При падении - забираем актуальное из PG+kafka

Думали про такое, но смущает "время на прогрев"

источник

13:58пожаловаться #19

A

Alexey in Архитектура данных

Проблема с kv еще с фильтрацией, можно конечно на redis и это решить, но хочется более элегантного способа, нежели ловить факт падения redis и как-то его прогревать.

источник

14:00пожаловаться #20

1
«
…
‹
77
78
79
80
81
82
83
›
…
»