Size: a a a

2019 December 03

FD

Farkhad Dzhum in Data Engineers
если делится знаниями, это бан. То что то в этом мире пошло не так
источник

Е

Евгений in Data Engineers
вообще поражаюсь с людей, которым жалко 500р за книжку, которая сделает x2 к зарплате
источник

OI

Oleg Ilinsky in Data Engineers
Евгений
вообще поражаюсь с людей, которым жалко 500р за книжку, которая сделает x2 к зарплате
есть гарантии?)
источник

Е

Евгений in Data Engineers
Oleg Ilinsky
есть гарантии?)
5 девяток
источник

FD

Farkhad Dzhum in Data Engineers
Евгений
вообще поражаюсь с людей, которым жалко 500р за книжку, которая сделает x2 к зарплате
Против моей философии, открытые знания
источник

Е

Евгений in Data Engineers
Farkhad Dzhum
Против моей философии, открытые знания
иди в издательство ДМК об этом напиши
источник

Е

Евгений in Data Engineers
пусть бесплатно книги переводят
источник

Е

Евгений in Data Engineers
к тому же в интернете полно материалов по скале и без этой книги. хочешь открытые данные - гугли курс на курсере от одерски
источник

OI

Oleg Ilinsky in Data Engineers
моралфаги подъехали
источник

Е

Евгений in Data Engineers
ну да
источник

OI

Oleg Ilinsky in Data Engineers
так, а как её там читать то?
источник

Е

Евгений in Data Engineers
покупаешь, читаешь
источник

OI

Oleg Ilinsky in Data Engineers
ну типа я заплатил и каждый раз надо идти на сайт?
источник

Е

Евгений in Data Engineers
Oleg Ilinsky
ну типа я заплатил и каждый раз надо идти на сайт?
можешь приложение скачать
источник

OI

Oleg Ilinsky in Data Engineers
а, точно
источник

OI

Oleg Ilinsky in Data Engineers
источник

AL

Artem Likhomanenko in Data Engineers
Sergey Zakharov
Ну на вскидку, как уже тут писали, можно хранить документы в hbase, спроектировав ключ и настроив ttl. Далее через lily hbase indexer (в клаудере это вроде key-valye store indexer service) реплицировать данные из hbase в solr-кластер для полнотекстового поиска по ним. В solr есть schemaless-mode, можно включить этот режим, либо, настроив data import handler в конфиге, преобразовывать входящий документ в необходимый формат.
Спасибо, ещё бы знать сколько все это добро генерит оверхеда по данным плюсом к сырым данным на hdfs. Потому что ограничение ест на место, но есть много рам, 7 тачек по 512гб каждая
источник

SZ

Sergey Zakharov in Data Engineers
Artem Likhomanenko
Спасибо, ещё бы знать сколько все это добро генерит оверхеда по данным плюсом к сырым данным на hdfs. Потому что ограничение ест на место, но есть много рам, 7 тачек по 512гб каждая
Экспериментируйте =) В solr можно не хранить сами данные, а только индексы, которые будут возвращать id документа, которы потом можно забирать из hbase.
источник

OI

Oleg Ilinsky in Data Engineers
Farkhad Dzhum
мы не правильно друг друга поняли, я хочу бесплатно её скачать 😄
в оригинале она называется scala for impatient (это подсказка)
источник

FD

Farkhad Dzhum in Data Engineers
Oleg Ilinsky
в оригинале она называется scala for impatient (это подсказка)
ок, кэп
источник