Телеграмм чат группы dba

Ещё раз, Вы делаете так:
1. Создаёте [аналог] уникального индекса по ("ключ" + "значение") — это уж должны уметь все KV.
2. Делаете префиксный поиск — это умеет любое b-tree.

Т.е. полный аналог того, что у Вас есть сейчас в PostgreSQL — у Вас PK(login, password), и
"SELECT * FROM leak_entries WHERE login = 'a_login';" его использует, так?

источник

10:46пожаловаться #9

ЯТ

Я Акула Туруруру... in DBA - русскоговорящее сообщество

Yaroslav Schekin

Ещё раз, Вы делаете так:
1. Создаёте [аналог] уникального индекса по ("ключ" + "значение") — это уж должны уметь все KV.
2. Делаете префиксный поиск — это умеет любое b-tree.

Т.е. полный аналог того, что у Вас есть сейчас в PostgreSQL — у Вас PK(login, password), и
"SELECT * FROM leak_entries WHERE login = 'a_login';" его использует, так?

да

источник

10:47пожаловаться #10

YS

Yaroslav Schekin in DBA - русскоговорящее сообщество

Я Акула Туруруру

Вставки по 100к элементов, всего 4 млрд пока. Каждая вставка ~20 секунд пока что

Хмм... при типичных размерах login, password и source (тут не уверен, что это) — это как-то уж очень медленно...

источник

10:47пожаловаться #11

YS

Yaroslav Schekin in DBA - русскоговорящее сообщество

Я Акула Туруруру

да

Ну так и почему бы этому не работать?

источник

10:47пожаловаться #12

ЯТ

Я Акула Туруруру... in DBA - русскоговорящее сообщество

Yaroslav Schekin

Ну так и почему бы этому не работать?

> Создаёте [аналог] уникального индекса по ("ключ" + "значение") — это уж должны уметь все KV

Я пока не нашёл такого. У всех поведение по дефолту - уникальный ключ, каждая следующая вставка перезапишет предыдущую. Дальше нужно рыть доки - можно ли включить хранение дубликатов и т.д.

источник

10:52пожаловаться #13

ЯТ

Я Акула Туруруру... in DBA - русскоговорящее сообщество

В основном такие БД заточены под хранение json в value - я так прикинул, что это будет то же самое, что в постгресе, только ещё хуже из-за постоянного парсинга жсон

источник

10:53пожаловаться #14

YS

Yaroslav Schekin in DBA - русскоговорящее сообщество

Я Акула Туруруру

> Создаёте [аналог] уникального индекса по ("ключ" + "значение") — это уж должны уметь все KV

Я пока не нашёл такого. У всех поведение по дефолту - уникальный ключ, каждая следующая вставка перезапишет предыдущую. Дальше нужно рыть доки - можно ли включить хранение дубликатов и т.д.

> У всех поведение по дефолту - уникальный ключ, каждая следующая вставка перезапишет предыдущую.

И это именно то, что я написал, и что Вам нужно!
Т.е. ключом там будет login+password, значением — source, так?
А потом нужна поддержка поиска по префиксу (т.е. в SQL это было бы "WHERE login_password LIKE 'login%'"), неужели в большинстве этого нет?

источник

10:57пожаловаться #15

ЯТ

Я Акула Туруруру... in DBA - русскоговорящее сообщество

Yaroslav Schekin

> У всех поведение по дефолту - уникальный ключ, каждая следующая вставка перезапишет предыдущую.

И это именно то, что я написал, и что Вам нужно!
Т.е. ключом там будет login+password, значением — source, так?
А потом нужна поддержка поиска по префиксу (т.е. в SQL это было бы "WHERE login_password LIKE 'login%'"), неужели в большинстве этого нет?

Да, примерно так. Тогда это уже не b-tree индекс. В couchbase вроде нашёл что-то типа того. Вопрос опять же, сколько времени такой индекс будет строиться и сколько места займёт - мб даже хуже, чем в постгресе окажется

источник

11:05пожаловаться #16

ЯТ

Я Акула Туруруру... in DBA - русскоговорящее сообщество

источник

11:05пожаловаться #17

YS

Yaroslav Schekin in DBA - русскоговорящее сообщество

Я Акула Туруруру

Да, примерно так. Тогда это уже не b-tree индекс. В couchbase вроде нашёл что-то типа того. Вопрос опять же, сколько времени такой индекс будет строиться и сколько места займёт - мб даже хуже, чем в постгресе окажется

> Тогда это уже не b-tree индекс.

Да почему (и в PostgreSQL работает, кстати — как и должно)?!

источник

11:07пожаловаться #18

ЯТ

Я Акула Туруруру... in DBA - русскоговорящее сообщество

Yaroslav Schekin

> Тогда это уже не b-tree индекс.

Да почему (и в PostgreSQL работает, кстати — как и должно)?!

ну, там хоть и написано

The optimizer can also use a B-tree index for queries involving the pattern matching operators LIKE and ~

но на практике у меня всегда выходил фуллскан

источник

11:09пожаловаться #19

YS

Yaroslav Schekin in DBA - русскоговорящее сообщество

Я Акула Туруруру

ну, там хоть и написано

The optimizer can also use a B-tree index for queries involving the pattern matching operators LIKE and ~

но на практике у меня всегда выходил фуллскан

И правильно написано. Почему в какой-то ситуации был seq. scan — это другой вопрос.

источник

11:11пожаловаться #20