И таки да, очень странно, что в спарке при сохранении чекпоинтов в s3 до сих пор используется код стандартного hdfs подхода (с темп директорией и последующим переименованием).
Коллеги! Подскажите. Есть таблица в phoenix(5.0) hbase 2.0. фильтр вида column like 'х%' выдает условно 50 строк, фильтр вида column like 'х%' AND column2 = 'abc' выдает 100 строк. Обновление статистики делал. Вопрос, что не так с фениксом?
Может кто заморачивался с вариантом на efs или кастомным вариантом с hdfs + периодической репликацией на s3?
если кто и заморачивался, он об этом молчит как партизан. тоже, блин, приходится костылить с гонянием терабайтов туда-сюда. s3-dist-cp — жуткое говно. emrfs из-за динамы стоит конских денег. что делать — хз.
если кто и заморачивался, он об этом молчит как партизан. тоже, блин, приходится костылить с гонянием терабайтов туда-сюда. s3-dist-cp — жуткое говно. emrfs из-за динамы стоит конских денег. что делать — хз.