Size: a a a

2020 July 28

AZ

Anton Zadorozhniy in Data Engineers
Жмака
Не wal'ы а прям hbase файлы?
у меня есть такой клиент
источник

AZ

Anton Zadorozhniy in Data Engineers
даже два
источник

Ж

Жмака in Data Engineers
А почему тогда не попробовать сплиттинг улучшить если есть горячие регионы?
источник

AZ

Anton Zadorozhniy in Data Engineers
с HBase вообще много возможностей с SSD, например туда можно Bucket Cache вынести
источник

N

Nikita Blagodarnyy in Data Engineers
Alexey Evdokimov
ещё бы не правда. был у меня оракле дба с дипломами в конторе. и смотрел я, как он запросы переписывает, так это какая-то злоебучая unholy magic. чё я писал на наивном sql, и чё в итоге у него было на диалекте. в тыщи раз быстрее запросы работали на терабайтовой базе
а не вспомните, что там такое волшебное было? для общего развития. я так вроде кроме connect by, model, XML и grouping sets ничего оракл-специфичного в диалекте не вспоминаю.
источник

Ж

Жмака in Data Engineers
Anton Zadorozhniy
с HBase вообще много возможностей с SSD, например туда можно Bucket Cache вынести
Чтобы вся память в mem store ушла?
источник

Д

Дмитрий in Data Engineers
Nikita Blagodarnyy
а не вспомните, что там такое волшебное было? для общего развития. я так вроде кроме connect by, model, XML и grouping sets ничего оракл-специфичного в диалекте не вспоминаю.
Обычно все вспоминают о их диалекте join, а тут похоже говорят о хинтах. Хинты там есть очень специфичные, особенно на экзадате.
источник

N

Nikita Blagodarnyy in Data Engineers
Ну в целом вендор рекомендует хинты использовать только в крайнем случае.
источник

T

T in Data Engineers
источник

OI

Oleg Ilinsky in Data Engineers
Oleg Ilinsky
Привет!
Вопрос: если spark thrift server и при попытке подключиться ловлю вот такую ошибку
20/07/28 09:17:21 WARN HiveConnection: Failed to connect to localhost:10000
Unexpected end of file when reading from HS2 server. The root cause might be too many concurrent connections. Please ask the administrator to check the number of active connections, and adjust hive.server2.thrift.max.worker.threads if applicable.
Error: Could not open client transport with JDBC Uri: jdbc:hive2://localhost:10000/: null (state=08S01,code=0)

хотя в конфиге hive.server2.thrift.max.worker.threads стоит в 150
Не подскажете, куда копать? В логах чего-то особенного я не вижу 🤔
чё прям вообще ни у кого не было?)
источник

A

Alex in Data Engineers
Думаешь что-то новое скажут :) но в фоне запустить можно будет
источник

AZ

Anton Zadorozhniy in Data Engineers
Жмака
Чтобы вся память в mem store ушла?
memstore хранит изменения, это не кэш; bucket cache используется как L2 off-heap кэш для блоков, освобождая  Block Cache.. можно на чтение разогнаться до показателей Redis
источник

T

T in Data Engineers
Alex
Думаешь что-то новое скажут :) но в фоне запустить можно будет
Да я тоже думаю фоном послушать, ну ещё может ченить про форк алибабы расскажут. Кстати они его уже в мерджили в обычный флинк?
источник

A

Alex in Data Engineers
Да
источник

A

Alex in Data Engineers
В 1.10 или 1.11 блинк уже дефолт тейбл движок
источник

T

T in Data Engineers
👍
источник

A

Alex in Data Engineers
Сейчас усиленно работают над оптимизацией батч запросов
источник

A

Alex in Data Engineers
В 10 пайфлинк подвезли
В 11 апи ближе к пандасу (местная коала, но сразу в кодовой базе)

Китайцы в али там что дурные комитят :)
источник

T

T in Data Engineers
Alex
В 10 пайфлинк подвезли
В 11 апи ближе к пандасу (местная коала, но сразу в кодовой базе)

Китайцы в али там что дурные комитят :)
у них же своя жвм еще?  не сделают они в конце концов вендрор лок флинку?
источник

A

Alex in Data Engineers
Jvm не публичная и не будут делать так как все же в опенсорс уходит
источник