Size: a a a

Обсуждения техдирские

2019 September 12

ИП

Иван Повстен in Обсуждения техдирские
а их сортировка?
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Иван Повстен
а слияние результатов как?
Никак, они не зависят друг от друга.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Eugene Kuzovlev
А вариант слития этих двух миллионов баз в два миллиона других сущностей внутри одного распределенного кластера не рассматривается?
Нет. Зачем?
источник

ИП

Иван Повстен in Обсуждения техдирские
то есть на выходе 2 миллиона результатов?
источник

PV

Pavel Velikhov in Обсуждения техдирские
Mikhail Kudinov
Нет не считаю . Но мы решили запускать новые проекты с аутсорсом постепенно своё наращивая . Ребят посоветуйте компанию партнера . Запускаем проект - новый сайт+ личный кабинет+ онлайн магазин . Все это в интеграции  с корпоративными системами (1с, SalesForce, есть RabbitMQ). Желательно чтобы партнёр с хорошим опытом микросервисной архитектуры. Ну то есть просто веб студия не покатит. Своей веб разработки сейчас нет, только большая 1сная , в процессе думаю добавим.
Могу посоветовать партнера для такого рода дата-дривен проектов, это компания ADV. Они и с очередями работают, и начали немного ML тоже
источник

EK

Eugene Kuzovlev in Обсуждения техдирские
Andrey Shetukhin
Нет. Зачем?
в качестве варианта решения и наброса мыслей.
источник

СХ

Старый Хрыч in Обсуждения техдирские
Andrey Shetukhin
Да, и как ой у Монги поиск по текстам? Вы о чём вообще?
Ну пока да, спарк+btrfs+lz4, но проц и оперативу под кеш я помню тратились
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Eugene Kuzovlev
в качестве варианта решения и наброса мыслей.
Если я солью 2 млн баз в одну и сделаю индекс по идентификатору базы, то тогда при каждом поиске будет выбираться максимум 1/2000000 часть полнотекстового индекса. А читаться будет весь полнотекстовый индекс. Окей, не весь, но значительная часть. Так не работает.
источник

MK

Mikhail Kudinov in Обсуждения техдирские
Pavel Velikhov
Могу посоветовать партнера для такого рода дата-дривен проектов, это компания ADV. Они и с очередями работают, и начали немного ML тоже
Спасибо за совет
источник

СХ

Старый Хрыч in Обсуждения техдирские
Andrey Shetukhin
Нет. Своё решение.
Только сделайте хотяб 10 subvol
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Зачем? Почему именно 10?
источник

СХ

Старый Хрыч in Обсуждения техдирские
Ну я ограничивал не более 250к файлов на subvol, если по ним часто читать
источник

VK

Viacheslav Kaloshin in Обсуждения техдирские
Если базы хоть чуть-чуть пересекаются, то я бы посмотрел в сторону zfs
источник

СХ

Старый Хрыч in Обсуждения техдирские
Гемора больше
источник

VK

Viacheslav Kaloshin in Обсуждения техдирские
зато гораздо больше пруфов, что работает. а дедупликация иногда творит чудеса
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Viacheslav Kaloshin
Если базы хоть чуть-чуть пересекаются, то я бы посмотрел в сторону zfs
Нет, базы сами по себе не пересекаются. Тексты разные. Просто как и любые тексты на естественных языках они отлично жмутся.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
В общем, я запустил тестирование btrfs на 100Тб. Посмотрим, что из этого получится. Если всё ок - запустим на петабайте.

Если кому интересно, результаты к октябрю будут, напомните, отпишусь сюда.
источник

ЮВ

Юра В in Обсуждения техдирские
Andrey Shetukhin
В общем, я запустил тестирование btrfs на 100Тб. Посмотрим, что из этого получится. Если всё ок - запустим на петабайте.

Если кому интересно, результаты к октябрю будут, напомните, отпишусь сюда.
а что оно, такое медленное? )
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Юра В
а что оно, такое медленное? )
В смысле, медленное? Пока перепишется, пока проиндексируется, пока нагрузочные тесты пройдут. У  нас же не хипстерская контора, нам надо полный цикл проверок сделать.
источник

СХ

Старый Хрыч in Обсуждения техдирские
Andrey Shetukhin
В общем, я запустил тестирование btrfs на 100Тб. Посмотрим, что из этого получится. Если всё ок - запустим на петабайте.

Если кому интересно, результаты к октябрю будут, напомните, отпишусь сюда.
С lzo or lz4?
источник