Size: a a a

2021 March 30

AS

Andrey Smirnov in Data Engineers
Anton Zadorozhniy
Одна большая реклама GDPR, CCPA и прочих хороших аббревиатур
ВТБ не просто так Медиалогию покупал чтобы пугаться таких абюревиатур
источник
2021 March 31

SS

Sergey Shushkov in Data Engineers
Никита
А подскажите плс сервисы совместного кодирования в окошке для интервьюирования
источник

ДД

Дмитрий Демитов... in Data Engineers
Доброго времени суток!
А кто-нибудь обновлял ambari-server 2.7.4 из состава HDP до 2.7.5 собранного из исходников?
А то собрал, установил пакеты, а ambari-server upgrade не обновляет схему БД
источник

AE

Alexey Evdokimov in Data Engineers
задам очередной мега-тупой вопрос.

кто-нить знает такую структуру данных, которая ведёт себя как обычная мапа со строковыми ключами, но
* позволяет выбирать ключи по произвольному префиксу
* позволяет выбирать ключи по постфиксу
* показывает выбранные ключи как live view (то есть при модификации добавляет/изменяет/удаляет соответствующие ключи из основной мапы)
* достаточно компактное (чтоб можно было поднять кучку таких структур, но не сожрать всю память)

речь не о k-v хранилище, а чём-нить локальном, на несколько тыщ (или десятков тыщ) ключей.

на мапе мапов такое можно сделать, но крайне неудобно. да даже и на просто хэшмапе тоже можно, но постоянно дёргать .filter() медленно, и с конкаррент модификациями всё не алё
источник

N

Nikita Blagodarnyy in Data Engineers
Похоже на обычный b tree индекс в бд, не?
источник

PK

Pavel Klemenkov in Data Engineers
Alexey Evdokimov
задам очередной мега-тупой вопрос.

кто-нить знает такую структуру данных, которая ведёт себя как обычная мапа со строковыми ключами, но
* позволяет выбирать ключи по произвольному префиксу
* позволяет выбирать ключи по постфиксу
* показывает выбранные ключи как live view (то есть при модификации добавляет/изменяет/удаляет соответствующие ключи из основной мапы)
* достаточно компактное (чтоб можно было поднять кучку таких структур, но не сожрать всю память)

речь не о k-v хранилище, а чём-нить локальном, на несколько тыщ (или десятков тыщ) ключей.

на мапе мапов такое можно сделать, но крайне неудобно. да даже и на просто хэшмапе тоже можно, но постоянно дёргать .filter() медленно, и с конкаррент модификациями всё не алё
Вообще ожидать, что одна и та же структура будет эффективно делать и префиксные и постфиксные операции с низким потреблением памяти вряд ли приходится. Если ограничиться чем-то одним, то посмотри структуру Trie (это не описка)
источник

AE

Alexey Evdokimov in Data Engineers
Pavel Klemenkov
Вообще ожидать, что одна и та же структура будет эффективно делать и префиксные и постфиксные операции с низким потреблением памяти вряд ли приходится. Если ограничиться чем-то одним, то посмотри структуру Trie (это не описка)
а оно есть в виде готового коммонса для 8 жабы?

постфиксные view можно с reversed keys сделать, я думаю
источник

N

Nikolay in Data Engineers
Pavel Klemenkov
Вообще ожидать, что одна и та же структура будет эффективно делать и префиксные и постфиксные операции с низким потреблением памяти вряд ли приходится. Если ограничиться чем-то одним, то посмотри структуру Trie (это не описка)
В трай не будет постфиксных чтений быстрых.
источник

AE

Alexey Evdokimov in Data Engineers
и насчёт live view, нужно, чтобы submap был modifiable
источник

A

Alex in Data Engineers
Nikolay
В трай не будет постфиксных чтений быстрых.
Ну можно построить трай на реверснутых строках
источник

A

Alex in Data Engineers
Но это будет 2 разных трая в памяти
источник

AE

Alexey Evdokimov in Data Engineers
ну засинкать два дерева эт меньшая проблема чем на каждый чих дёргать .filter() и лочить всю мапу
источник

AE

Alexey Evdokimov in Data Engineers
тэк, в commons-collections4 есть PatriciaTrie, вроде как то что нужно
источник

AE

Alexey Evdokimov in Data Engineers
по ходу и сабмапы оно возвращает modifiable
источник

N

Nikita Blagodarnyy in Data Engineers
Граждане, а что надо сделать с алиасом HA HDFS, чтобы другие сервисы его могли видеть по URI? Чтобы вот хуе мог работать с http://my_very_ha_fs:8020
источник

AE

Alexey Evdokimov in Data Engineers
интересно только сколько памяти кушает, но проверим
источник

ЕГ

Евгений Глотов... in Data Engineers
Nikita Blagodarnyy
Граждане, а что надо сделать с алиасом HA HDFS, чтобы другие сервисы его могли видеть по URI? Чтобы вот хуе мог работать с http://my_very_ha_fs:8020
По идее, есть некий hdfs namespace, который позволяет обращаться к кластеру как раз по имени, но я когда-то тестил - не взлетело
источник

ЕГ

Евгений Глотов... in Data Engineers
Лучше всего наверно будет просто прокси-сервер замутить, который будет не особо ha, зато хотя бы один адрес иметь😆
источник

ЕГ

Евгений Глотов... in Data Engineers
Ну и он будет актуализировать активную ноду
источник

N

Nikita Blagodarnyy in Data Engineers
Евгений Глотов
По идее, есть некий hdfs namespace, который позволяет обращаться к кластеру как раз по имени, но я когда-то тестил - не взлетело
Не, оно точно как-то из коробки работает, только я не знаю как. Обычно это ходуп инженеры всё настраивали, а ямл программисты не умеют.
источник