Size: a a a

Архитектура ИТ-решений

2020 December 24

N

Nikolay in Архитектура ИТ-решений
разные есть требования. Вот тотже ZK не дает строгую консистентность по умолчанию, а кассандра может терять данные, как показано в тех тестамх из-за clock skew.
источник

N

Nikolay in Архитектура ИТ-решений
но это не значит совсем, что эти базы не нужны
источник

PD

Phil Delgyado in Архитектура ИТ-решений
Ну, zk не база, а хранилище блокировок. А Кассандра - скорее не нужна, да )
источник

N

Nikolay in Архитектура ИТ-решений
в ЗК есть разные типы znode.
источник

N

Nikolay in Архитектура ИТ-решений
если данные имутабельны, то кассандра норм.даже она даст большую пропускную способность на вставку , чем что то другое
источник

I

Ivan in Архитектура ИТ-решений
Nikolay
это такой эктремальный способ разобраться с базами, если зайти через джепсон тесты )
Кстати, да, тоже источник информации ( https://jepsen.io/analyses )
источник

I

Ivan in Архитектура ИТ-решений
Phil Delgyado
Ну или PG, если масштабируемость по горизонтали не нужна )
А что у него с горизонтальным масштабированием? Он, если не ошибаюсь, с 11 версии (может даже раньше) шардируется даже без Citus, через партиционирование + FDW (в доке об этом пишут не очевидно, но я знаю ребят, которые так делали).
источник
2020 December 25

PD

Phil Delgyado in Архитектура ИТ-решений
Ivan
А что у него с горизонтальным масштабированием? Он, если не ошибаюсь, с 11 версии (может даже раньше) шардируется даже без Citus, через партиционирование + FDW (в доке об этом пишут не очевидно, но я знаю ребят, которые так делали).
Не знаю, партиционирование есть, а вот про ядра-память нет ничего, вроде
источник

I

Ivan in Архитектура ИТ-решений
Phil Delgyado
Не знаю, партиционирование есть, а вот про ядра-память нет ничего, вроде
источник

PD

Phil Delgyado in Архитектура ИТ-решений
А, да, они же FDW оптимизировали. Странная и непростая замена RAC, но зато бесплатно )
При том, что я терпеть не могу RAC - вообще круто
источник

PD

Phil Delgyado in Архитектура ИТ-решений
Ну PG сейчас да, выбор по умолчанию
источник

AM

Alexander Makarov in Архитектура ИТ-решений
Всем спасибо за советы!
источник

ОИ

Олег Игонин... in Архитектура ИТ-решений
Саддам Хусейн
Кажется, что в некоторых областях (типа интернет-маркетинг) просто нет выбора, им приходится работать с такими нечеткими (постоянно уточняющимися) данными, типа "вчера мы получили эти три разных запроса от разных устройств, сегодня по куке или другим косвенным признакам определили что два из них от одного клиента, завтра узнаем что эти два на самом деле разные люди, но предположительно из одной семьи".
Это типа как progressive jpeg, с первых байт есть какие-то общие очертания и каждая новая порция данных уточняет их, и как с береговой линией, это процесс может быть бесконечным.
Передо мной возможно скоро будет стоять очень похожая задача, буду благодарен если кто-нибудь подскажет какие есть практики к проектированию хранилищ для таких данных
У нас так в воронку попадают ордера.
Дистрибьютор может в ордере что угодно расписывать, из-за чего сотрудникам отдела, который принимал эти заявки приходилось разгребать всё руками.

Мы подключили автоматизацию, которая сопоставляла пришедшие данные с данными в бд. И там учитываются как сокращения в названиях компаний/адресах/..., так и ошибки, в которых учитывался допуск (1-3 знака) и разные окончания (например, если использовалось множественное число). Если всё совпало, то можно процессить ордер, иначе - в ручной разбор.

Чтобы проверить качество можно прогнать алгоритм через старые закрытые ордера по входящим данным и сравнить результат с тем, что запроцессилось раньше.
Всегда остаётся определённый % не верного результата, но он минимален.

Также параллельно вычищали мусор из базы данных и делали более удобным и простым оформление ордера на стороне дистрибьютора. По возможности добавляли им доступ к идентификаторам (внешним), которые позволяли точно идентифицировать пользователя.

Но в целом, всё сводится к тому, что есть процесс до закрытия ордера, в котором данные ордера могут обогащаться, и момент закрытия ордера, в который надо точно знать кто и что купил.

Надеюсь вам этот опыт поможет.
источник
2020 December 26

A

Alexandr in Архитектура ИТ-решений
источник
2020 December 27

VI

Vladimir Ivanov in Архитектура ИТ-решений
источник
2020 December 31

ℝuƷ1Ʒʒ7 in Архитектура ИТ-решений
Недавно задумался, почему Redis не взял Raft и не сделал кластер на нём?
Начал изучать вопрос и оказалось, что Yossi Gottlieb (главный архитектор RedisLab) в 2018 именно это и начал делать под названием RedisRaft.
А в июне 2020 они прошли тесты Jepsen с которым помогает Kyle Kingsbury - https://jepsen.io/analyses/redis-raft-1b3fbf6
Это будет логичным шагом для нормального горизонтального масштабирования redis
https://redislabs.com/blog/redisraft-new-strong-consistency-deployment-option/
источник

N

Nikolay in Архитектура ИТ-решений
ℝuƷ1Ʒʒ7
Недавно задумался, почему Redis не взял Raft и не сделал кластер на нём?
Начал изучать вопрос и оказалось, что Yossi Gottlieb (главный архитектор RedisLab) в 2018 именно это и начал делать под названием RedisRaft.
А в июне 2020 они прошли тесты Jepsen с которым помогает Kyle Kingsbury - https://jepsen.io/analyses/redis-raft-1b3fbf6
Это будет логичным шагом для нормального горизонтального масштабирования redis
https://redislabs.com/blog/redisraft-new-strong-consistency-deployment-option/
а сейчас как у них кластер работает ? там же есть репликация...
источник

ℝuƷ1Ʒʒ7 in Архитектура ИТ-решений
Nikolay
а сейчас как у них кластер работает ? там же есть репликация...
простыми словами он не обеспечивает 100% консенсус данных по кластеру
источник

DS

Dmitry Simonov in Архитектура ИТ-решений
Коллеги! Вы все невероятно умные, талантливые и перспективные! Поздравляю всех с Наступающим Новым годом от имени коллег из своего техдирского канала @ctorecords! Дзынь 🥃 🍾🥳
источник
2021 January 01

AM

Anton Motonakha in Архитектура ИТ-решений
Задуматься к новому году?
источник