Size: a a a

2021 June 17

AS

Andrey Smirnov in Data Engineers
ты пишешь в эластик, чем пишешь? 5 шардов на одной машине, на разных? Экзекютеры на других машинах?
что значит долго, что говорит мониторинг эластика?
источник

Н

Никита in Data Engineers
не, я гружу из эластика на hdfs
источник

ПБ

Повелитель Бури... in Data Engineers
А можно сделать индекс по датам?
источник

Н

Никита in Data Engineers
все на разных машинах
источник

Н

Никита in Data Engineers
я и гружу по датам
источник

AZ

Anton Zadorozhniy in Data Engineers
больше шардов и больше экзекьюторов, другого решения нет
источник

AZ

Anton Zadorozhniy in Data Engineers
в целом это очень плохой паттерн, там когда эластик под нагрузкой или перестраивает чего будет совсем весело
источник

AZ

Anton Zadorozhniy in Data Engineers
лучше всего читать спарком из того места откуда у вас индекс наливается
источник

Н

Никита in Data Engineers
понятно, спасибо
источник

Н

Никита in Data Engineers
а что значит откуда индекс наливается не понял
источник

Н

Никита in Data Engineers
я просто не мейнтейню эластик и не знаю как он работает
источник

ПБ

Повелитель Бури... in Data Engineers
Т.е. 1 экзекутор=1 дата?
источник

Н

Никита in Data Engineers
у индекса название типа logstash-2020-01-01
источник

Н

Никита in Data Engineers
5 экзекьюторов качают из этого индекса
источник

AS

Andrey Smirnov in Data Engineers
а как качаешь, это запрос какой-то?
смотри нагрузку на эластик, можно увеличить число экзекютеров
источник

МК

Михаил Королев... in Data Engineers
я делал через файлы: эластик выгружает окнами в файлы, я гружу из файлов спарком в HDFS, было не очень быстро, но надежно и управляемо
источник

МК

Михаил Королев... in Data Engineers
по объему были данные за несколько лет, по миллиону записей в день, запись по 400+ полей
источник

МК

Михаил Королев... in Data Engineers
но это разово (перегрузил и забыл), поэтому так и сделал (перегрузил и забыл 😊)
источник

AS

Andrey Sutugin in Data Engineers
Всем привет!
Ни у кого в закромах Родины не осталось реп hdp-2.6.1/2.6.3?
источник

AZ

Anton Zadorozhniy in Data Engineers
Эластик это индекс просто, обычно он наливается из какого-то нормального процесса или стораджа (который не разваливается)
источник